Форум врачей-аспирантов > Вопрос по тесту ливиня

Помощь - Поиск - Пользователи - Календарь

Полная версия этой страницы: Вопрос по тесту ливиня

Форум врачей-аспирантов > Разделы форума > Медицинская статистика

nastushka

17.03.2016 - 18:02

Подскажите, если у меня тест Ливиня статистически значим р<0,05, т.е. дисперсии групп разнятся, как понять почему они разнятся? Какие именно наблюдения способствуют этому? Выборка 280 чел. Я делаю многофакторный дисперсионный анализ..

nokh

17.03.2016 - 20:11

Цитата(nastushka @ 17.03.2016 - 20:02)

Причин может быть несколько:

1. Одну вы сами назвали - этому могут способствовать отдельные наблюдения, попавшие в те или иные ячейки дисперсионного комплекса. Маловероятно, но может и такое быть.

2. Изменчивость признака реально различна для разных групп или подгрупп. Т.е. дисперсия увеличивается не за счёт отдельных экстремальных наблюдений, а как таковая: просто увеличивается разброс значений относительно среднего. В медицине такое часто, причём сложно угадать заранее где дисперсия больше должна быть. Может оказаться, что:
а) в группе сильно больных, где организм идёт в разнос и сильнее проявляются индивидуальные особенности, изменчивость увеличивается, а в группе менее больных или контроле изменчивость более канализирована и невелика.
б) в отсутствие сильных стрессирующих факторов (контроль) по каким-то показателям изменчивость может быть относительно велика, но при заболевании, когда организм мобилизируется, она снижается.
В моей небольшой практике - имею в виду когда интересовался этим - обычно а), но б) почему-то сидит в голове и вспоминается, а значит и такое когда-то было.

3. Неоднородность дисперсий может быть следствием ненормального распределения показателя, обычно - сильно положительно асимметричного распределения - с хвостом справа. Для асимметричных распределений дисперсия коррелирует со средним значением (для нормального распределения - нет). Таким образом если ячейки дисперсионного комплекса сильно отличаются средними, то и дисперсиями будут отличаться: где больше среднее, там и дисперсия больше.

Наиболее вероятен сценарий (3). Чтобы обнаружить такую асимметрию нужно посмотреть распределение остатков (Residuals) дисперсионного анализа. Если вдруг окажется, что оно симметричное и колоколообразное - значит причина в (2) и разобраться можно посмотрев статистику по ячейкам комплекса (обычно там не дисперсия, а корень из неё - стандартное отклонение). Если логики больной-здоровый или подобной медико-биологической не будет, значит (1) - и нужно опять посмотреть распределение - что за значения в хвостах справа и слева, может там совсем нетипмчные или сомнительные значения, ну типа "выбросы".

Поскольку я заочно склоняюсь к (3), то рецепт - предварительное преобразование всего массива данных по признаку. Можно прикинуть хотя бы логарифмированием -оно хорошо поджимает хвосты распределений, но не оптимально. Оптимально - преобразование Бокса - Кокса.

ogurtsov

17.03.2016 - 20:16

Нарисуйте для остатков дисперсионного анализа картинку такого типа: http://www.ats.ucla.edu/stat/r/gbe/ggplot5_boxplot.gif
Возможен вариант, когда в одной группе разброс будет существенно больше/меньше, чем в остальных, и тогда можно будет говорить, что виноваты преимущественно наблюдения из этой группы. Но возможен и другой вариант, когда дисперсия в группах изменяется систематически, и тогда получится, что все наблюдения виноваты одинаково.

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.