Цитата(nastushka @ 17.03.2016 - 20:02)

Подскажите, если у меня тест Ливиня статистически значим р<0,05, т.е. дисперсии групп разнятся, как понять почему они разнятся? Какие именно наблюдения способствуют этому? Выборка 280 чел. Я делаю многофакторный дисперсионный анализ..
Причин может быть несколько:
1. Одну вы сами назвали - этому могут способствовать отдельные наблюдения, попавшие в те или иные ячейки дисперсионного комплекса. Маловероятно, но может и такое быть.
2. Изменчивость признака реально различна для разных групп или подгрупп. Т.е. дисперсия увеличивается не за счёт отдельных экстремальных наблюдений, а как таковая: просто увеличивается разброс значений относительно среднего. В медицине такое часто, причём сложно угадать заранее где дисперсия больше должна быть. Может оказаться, что:
а) в группе сильно больных, где организм идёт в разнос и сильнее проявляются индивидуальные особенности, изменчивость увеличивается, а в группе менее больных или контроле изменчивость более канализирована и невелика.
б) в отсутствие сильных стрессирующих факторов (контроль) по каким-то показателям изменчивость может быть относительно велика, но при заболевании, когда организм мобилизируется, она снижается.
В моей небольшой практике - имею в виду когда интересовался этим - обычно а), но б) почему-то сидит в голове и вспоминается, а значит и такое когда-то было.
3. Неоднородность дисперсий может быть следствием ненормального распределения показателя, обычно - сильно положительно асимметричного распределения - с хвостом справа. Для асимметричных распределений дисперсия коррелирует со средним значением (для нормального распределения - нет). Таким образом если ячейки дисперсионного комплекса сильно отличаются средними, то и дисперсиями будут отличаться: где больше среднее, там и дисперсия больше.
Наиболее вероятен сценарий (3). Чтобы обнаружить такую асимметрию нужно посмотреть распределение остатков (Residuals) дисперсионного анализа. Если вдруг окажется, что оно симметричное и колоколообразное - значит причина в (2) и разобраться можно посмотрев статистику по ячейкам комплекса (обычно там не дисперсия, а корень из неё - стандартное отклонение). Если логики больной-здоровый или подобной медико-биологической не будет, значит (1) - и нужно опять посмотреть распределение - что за значения в хвостах справа и слева, может там совсем нетипмчные или сомнительные значения, ну типа "выбросы".
Поскольку я заочно склоняюсь к (3), то рецепт - предварительное преобразование всего массива данных по признаку. Можно прикинуть хотя бы логарифмированием -оно хорошо поджимает хвосты распределений, но не оптимально. Оптимально - преобразование Бокса - Кокса.