Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Дисперсионный анализ, неравенство дисперсий в сравниваемых группах
Blaid
сообщение 4.09.2017 - 10:57
Сообщение #1





Группа: Пользователи
Сообщений: 36
Регистрация: 27.08.2012
Пользователь №: 24128



Здравствуйте уважаемые участники форума!

Обращаюсь к Вам, поскольку хотелось бы прояснить для себя следующую ситуацию.
Как известно (в т.ч. из довольно многочисленных обсуждений и в этой ветке форума) основными требованиями (допущениями) корректности выполнения дисперсионного анализа (в данном случае беру простейший пример - однофакторный с тремя сравниваемыми группами) являются:
1. нормальность распределения т.н. остатков дисперсионного анализа
2. равенство дисперсий во всех сравниваемых группах

Так вот, интересует пункт 2. Как "бороться" с неравенством дисперсий известно (опять же из обсуждений в этой ветке) - делать нормализующее (дисперсии или же дисперсии + нормальность распределения) преобразование (Rundom pro soft в помощь или AtteStat). Собственно вопрос:
если выявлено неравенство дисперсий в сравниваемых группах (например, с помощью критерия Бартлетта или аналогичных), то как нужно делать преобразование?
Каждую из групп нужно преобразовывать отдельно, независимо от других? Или же следует преобразовывать единую выборку, полученную объединением отдельных независимых групп?

Спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 6.10.2017 - 23:25
Сообщение #2





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Blaid @ 4.09.2017 - 12:57) *
...
Так вот, интересует пункт 2. Как "бороться" с неравенством дисперсий известно (опять же из обсуждений в этой ветке) - делать нормализующее (дисперсии или же дисперсии + нормальность распределения) преобразование (Rundom pro soft в помощь или AtteStat). Собственно вопрос:
если выявлено неравенство дисперсий в сравниваемых группах (например, с помощью критерия Бартлетта или аналогичных), то как нужно делать преобразование?
Каждую из групп нужно преобразовывать отдельно, независимо от других? Или же следует преобразовывать единую выборку, полученную объединением отдельных независимых групп?
Спасибо!

Сначала по поводу преобразования. Преобразовывать можно и каждую группу отдельно, но только одинаковым преобразованием:) Например, квадратным корнем, логарифмом, арксинусом... Если же используются "крутые" преобразования, адаптивные к конкретным данным, типа Бокса - Кокса или Йео - Джонсона, то конечно, нужно преобразовывать весь массив с одинаковой лямбдой.

По поводу неоднородности дисперсий. Асимметрия распределения ошибки указывает на "эффект шкалы", когда мы измеряем данные одной "линейкой", а природа - другой. Для приведения их в соответствие, перед дисперсионным анализом логично использовать преобразования. Для себя я понимаю это как устранение некоего искусственного препятствия. В отличие от этого неоднородность дисперсий (НД), не устранённая преобразованием, является не искусственной, а естественной. Т.е. вполне логично, что, скажем, на начальных сроках после операции дисперсия показателя в группе высокая, а спустя полгода - низкая. С этой НД невозможно бороться, да и неправильно это будет: она свойственная данным и это наша беда, что нас интересует, как правило, только сдвиг центральной тенденции, а не плюсом - изменение рассеяния и формы распределения. Т.о. НД в дисперсионном анализе неудобна, но уж тут ничего не поделаешь.
Какие видятся варианты решения проблемы.

1. Использовать для проверки НД не критерий Бартлетта, а что получше. Известно, что критерий Бартлетта слишком часто радостно её находит. Sokal & Rohlf (Biometry) рекомедуют log-anova test. Его не найти в пакетах (может в R только..., не искал), но легко считается в любой программе, где есть обычный ANOVA.

2. Постараться в ходе преобразования не только нормализовать ошибку модели, но и выровнять дисперсии. Когда-то делал это в Rundom BC (Rundom Pro совсем неудобен для меня оказался, не осваивал...). Недавно мы её вспоминали добрым словом на форуме: http://forum.disser.ru/index.php?showtopic=4111

3. Использовать штраф по степеням свободы за несоблюдение однородности дисперсий. Т.е. использовать в однофакторном ANOVA, подход, аналогичный подходу Уэлча для t-критерия Стьюдента. Такой подход автоматом считается в пакете PAST.

4. Не заморачиваться по поводу неравенства дисперсий в самом ANOVA, а сконцентрироваться на пост-хоках. Критерию Геймса - Ховелла (Games-Howell test) НД - не помеха.

5. Использовать рандомизационный вариант ANOVA. Лучше exact permutation. Тогда вообще независимо от выполнения требований, p будет вычислено точно, а само значение F будет использоваться лишь в качестве одной из возможных статистик. Доступно почитать можно у Шитикова (Рандомизация и бутстреп). Сделать можно в R и Rundom pro.

Сообщение отредактировал nokh - 6.10.2017 - 23:30
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему