Сравнение трёх групп с большой разницей средних

Сравнение трёх групп с большой разницей средних

Vitek_22 Просмотр профиля	21.09.2024 - 15:02 Сообщение #1
Группа: Пользователи Сообщений: 27 Регистрация: 7.12.2012 Пользователь №: 24440	Товарищи, подсобите с анализом данных. 3 группы мышей: контроль, больные, леченные. Измерялось пройденное расстояние. Мыши с тяжёлыми двигательными нарушениями, поэтому по сравнению с контролем у них пройденное расстояние отличается на порядок. ANOVA и Tukey апостериорный показывают значимые отличия от контроля. но не между больными и леченными, хотя объективно между ними x2 разница. Интуиция подсказывает, что с такой разницей между средними сравнивать ANOVA некорректно. Но чем тогда и как это объяснить грамотно и какой критерий использовать? Если Стьюдента попарно использовать - выходит норм. Прикрепленные файлы Data1.xlsx ( 9,66 килобайт ) Кол-во скачиваний: 146

Ответов

nokh

24.09.2024 - 03:39

Сообщение #2

Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704

Как уже написал ИНО, требования модели дисперсионного анализа не выполняются: по критерию Левене (или как его по-русски) дисперсии неоднородны, по критерию Шапиро - Уилка остатки распределены ненормально. Прикрепил скриншоты анализа в бесплатном пакете PAST ( https://www.nhm.uio.no/english/research/resources/past/ ), который кстати в ряде моментов умеет больше чем Statistica, хотя сравнивать пакеты сложно, ввиду разных весовых категорий и назначения.

А вот с преобразованиями я бы поработал. Когда нужное преобразование неизвестно исходя из теории, можно использовать степенное преобразование Бокса - Кокса, которое приближает распределение данных к нормальному настолько, насколько позволяют сами данные. Это достигается итерационным подбором параметра лямбда. Преобразование многократно обсуждалось на форуме, но давно это было. Идея здесь такая, что мы можем либо 1) подбирать к нашим данным более подходящую статистическую модель, либо 2) преобразовать наши данные к статистической модели. Чисто философски что лучше 1) или 2) сказать нельзя, поскольку, скажем, если природа данных говорит, что площадь биологического объекта распределена ненормально, а квадратный корень из площади нормально, то естественно работать с квадратным корнем. Или если природа измеряет многие зависящие от скорости процессы скорее логарифмической линейкой, то и нам пользоваться ей естественно (скорость прямой реакции имеет ограничение варьирования слева, т.к. там зона нуля и отрицательных величин, а вправо варьировать можно: получается положительно асимметричное распределение, часто близкое к логнормальному). Для больших любителей непараметрики можно написать, что распространённые ранговые модели может и более универсальны, но не нужно забывать, что там данные тоже преобразуются, причём очень грубо - просто к порядковым местам, рангам. И если мы не видим, как такое преобразование делает статпакет для критерия Манна - Уитни или Краскела - Уоллиса, то это значит просто, что мы не считали критерии вручную и не знаем как работают эти методы. Короче, я за то, чтобы не отказываться от шкалы отношений или интервалов в пользу порядковой шкалы сразу, не попробовав менее грубые преобразования. Апостериорные сравнения по Данн в рамках Краскела - Уоллиса не находят различий между интересующими группами, хотя р близко к 0,10. Проблему можно решить добрав животных, но я против такого, если можно статистикой. Кстати, недавно узнал, что правильно не "по Данну", а по "Данн", т.к. Олив Джин Данн - женщина)) ( https://en.wikipedia.org/wiki/Olive_Jean_Dunn ) и предложила метод в статье "Multiple Comparisons Using Rank Sums" в 1964 г.

Если преобразовать сразу весь набор данных, то проблема с распределением остатков уходит, а с неоднородностью дисперсий нет. Поэтому можно использовать вариант п. Бокса - Кокса с одновременной нормализацией распределений и выравниванием дисперсий. Я умею делать такое только в очень старой программке, которую прикрепил. Она неудобная, копировать и вставлять данные из буфера получается только по одной колонке (есть такая опция в Edit), и забирать в буфер аналогично. Но она подобрала такую лямбду, что однородность дисперсий и нормальность остатков выполняются.

Теперь имеем право трактовать результаты ANOVA и проводить апостериорные сравнения. Различия между интересующими группами статистически значимы: р=0,019 по Тьюки. Лечение работает, хотя до контроля далеко, эффект "бледный" (comisora).

Сообщение отредактировал nokh - 24.09.2024 - 04:10

Эскизы прикрепленных изображений

Прикрепленные файлы

Rundom_Box_Cox.zip ( 336,81 килобайт ) Кол-во скачиваний: 142

Ответить с цитированием данного сообщения

Сообщений в этой теме

Vitek_22 Сравнение трёх групп с большой разницей средних 21.09.2024 - 15:02

ИНО Большая разница средник помехой быть не может, а т... 22.09.2024 - 11:35

comisora Цитата(Vitek_22 @ 21.09.2024 - 15:02... 22.09.2024 - 22:28

nokh Как уже написал ИНО, требования модели дисперсионн... 24.09.2024 - 03:39

ИНО Цитата(nokh @ 24.09.2024 - 03:39) Дл... 24.09.2024 - 12:13

Vitek_22 Спасибо за такое развёрнутое объяснение. Да... пр... 24.09.2024 - 22:23

ИНО Простые преподаватели бессильны сколь-нибудь сущес... 25.09.2024 - 01:11

Игорь Цитата(nokh @ 24.09.2024 - 04:39) Ко... 25.09.2024 - 10:29

ИНО То уже другая программа, там целая куча документов... 25.09.2024 - 16:44

Vitek_22 Цитата(ИНО @ 22.09.2024 - 11:35) Бол... 6.02.2025 - 19:28

nokh Цитата(Vitek_22 @ 6.02.2025 - 21:28)... 9.02.2025 - 09:11

Vitek_22 Цитата(nokh @ 9.02.2025 - 09:11) Как... 9.02.2025 - 22:02

Игорь Цитата(Vitek_22 @ 9.02.2025 - 22:02)... 27.02.2025 - 11:15

ИНО Цитата(Игорь @ 27.02.2025 - 11:15) Г... 2.03.2025 - 18:17

Игорь Цитата(ИНО @ 2.03.2025 - 18:17) По к... 6.03.2025 - 07:34

Vitek_22 Цитата(Игорь @ 27.02.2025 - 11:15) Н... 9.04.2025 - 16:46

ИНО Ну, если даже после консервативнейшей в мире попра... 7.02.2025 - 18:36

ИНО Ну, если ориентироваться в выборе статистических м... 10.02.2025 - 01:00

ИНО Не знаю, что там принято в доказательной медицине ... 7.03.2025 - 19:32

« Предыдущая тема · Медицинская статистика · Следующая тема »