Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> ANOVA и преобразование данных, Вопросы по результатам анализа данных в ANOVA
Cules2013
сообщение 10.07.2019 - 01:29
Сообщение #1





Группа: Пользователи
Сообщений: 27
Регистрация: 5.02.2018
Пользователь №: 30938



Работая с ANOVA возник ряд занимательных вопросов:
1. Вычитал, что если данные не соответствую ни нормальному распределению остатков, ни равенству дисперсий (стандартных отклонений), то лучше их преобразовать каким-то методом, т.к. большая разница в дисперсия также проблема и для непараметрических критериев. Могу ли я просто вручную сделать это преобразование: например, 1/х, ln (x) или x^n и просто выбрать наиболее подходящее, проверяя итоговые данные по Шапиро-Уилку? Я вот методом тыка вручную нашёл, что возведение данных в 6 степень наиболее оптимально для получения нормального распределения.
2. Уж ранее и в моих темах, и в других, был целый диспут по поводу того, что является условием для ANOVA - нормальное распределение исходных данных либо их остатков. Вроде как все разобрались, что остатков. Однако, я для интереса сравнил результаты по Шапиро-Уилку для сырых чисел и для их остатков - и не нашёл в уровне р никакой разницы, он идентичен. Отсюда вопрос - либо я что-то не понимаю и делаю не так, либо зачем делать больше работы, чтобы получить такой же исход?
3. При попарном сравнении в ANOVA есть пункт - "эффективность сопоставления", которая, в идеале, должна быть p<0,05. В мануале к ГрафПэду написано, что если р - большое, то как бы эффективность нашего сравнения низкая, и надо бы выбрать ANOVA для несвязанных выборок. Однако, ещё нужно учесть нашу задумку по эксперименту и то, как принято вообще обрабатывать наш тип данных в лит-ре. У меня какой-то диссонанс возник по этому поводу:
а) а какое мы вообще имеем право брать ANOVA для несвязанных выборок, если у нас они по-факту связанные? Не важно какая там при этом эффективность попарного сравнения .
б) а какой тогда смысл вообще учитывать эту эффективность, если многое решает протокол и принятые нормы в обработке данных такого типа?
в) но если мы пренебрежём высоким р для эффективности сравнения, то рискуем получить неадекватные результаты. И что делать?
4. Опять же в попарных сравнениях ANOVA есть поправка Гайссера-Гринхауза для сферичности. Изначально нам рекомендуют её брать, предполагая, что сферичность данных скорее всего нарушена. Однако, потом в результатах мы видим уровень р для неё и можем сказать, нарушена она всё-таки или нет. Если нет, мы же можем/должны переделать ANOVA уже без этой поправки, т.к. она же снижает мощность критерия?
5. Почему в Граф Пэде Критерий Бартлетта и Брайна-Форсайта для сравнения равенства дисперсий рассчитывается только для несвязанных выборок? Это же условие для любого вида ANOVA, для связанных выборок тоже?
6. Я уже касался когда-то этого вопроса, но так и не получил того ответа, который ожидал. Как просто и адекватно визуализировать данные, если я их преобразовал, допустим, возведением в степень? Графически суть особо не меняется, но там уже другие количественные значения. Могу ли я график оставить по нативным данным, а звёздочки различий между ними поставить уже по преобразованным данным? Или лучше тогда "нормализовать" как-то данные, допустим, перевести их в проценты?

Сообщение отредактировал Cules2013 - 10.07.2019 - 01:34
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему