Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Ранговый аналог дисперсионного анализа, (Порядковая регрессия, Cumulative link models, CLM)
nokh
сообщение 2.09.2024 - 21:43
Сообщение #1





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Наконец-то нашёл ранговую замену (функциональный аналог) многофакторному дисперсионному анализу - порядковую регрессию.

Как считал раньше.
1) Если данные - полноценные количественные показатели (в биологии и медицине такие признаки имеют чаще ненормальное распределение разной степени асимметрии) , то можно использовать нормализующее преобразования Бокса - Кокса, а далее использовать классические модели дисперсионного анализа. Существуют способы сделать разные варианты преобразования Бокса-Кокса: можно для всего набора целиком (без учёта групп, подгрупп), можно с учётом групп, можно также с учётом как нормализации распределения ошибки, так и с учётом требования равенства дисперсии в группах/подгруппах, можно даже многомерное (для любителей MANOVA)... Всё это обсуждалось на этом форуме, давались ссылки на пакеты вне среды R, которые преимущественно уже устарели. Я последнее время не парился: делал преобразование для всего массива данных, а после anova смотрел распределение ошибки: чтобы визуально более-менее симметрично было.
2) В некоторых случаях вместо двухфакторного анализа использовал ранговый критерий Фридмана. Это - ранговый аналог однофакторного дисперсионного анализа с повторными наблюдениями или двухфакторного дисперсионного анализа с рандомизированными блоками. Приходилось считать 2 варианта: с использованием групп как факторов (внутриблоковая изменчивость выступает ошибкой) и с использованием блоков как второго фактора (внутригрупповая дисперсия по первому фактору выступает ошибкой). Критерий также неоднократно обсуждался на форуме. В рамках критерия Фридмана возможно проведение апостериорных сравнений, а по его результатам удобно рассчитывать коэффициент конкордации Кендалла - прямо из статистики хи-квадрат. Минусы такого подхода - это неполноценная замена двухфакторному дисперсионному анализу, т.к. невозможно оценить взаимодействие факторов: для двухфакторного anova с единственным наблюдением на ячейку комплекса проверку на взаимодействие можно провести косвенно - тестом Тьюки на неаддитивность, а как сделать подобное для Фридмана - не знаю. Также если факторов больше двух - критерий неприменим.

Как можно сейчас.
Ранжируем все наблюдения без учёта групп/подгрупп и проводим порядковую регрессию с использованием факторов в качестве регрессоров. Насколько понял посмотрев по диагонали, это что-то вроде общих линейных моделей, которые почти полностью вытеснили классический дисперсионный анализ. А значит возможно включение в модель не только взаимодействий, но и вложенных эффектов. Короче, полноценный ранговый функциональный аналог general linear models.

Знакомство можно начать отсюда: https://rcompanion.org/handbook/G_01.html
Примеры есть на этом же ресурсе, я использовал этот пример: https://rcompanion.org/handbook/G_11.html Только тип ошибки в общем случае нужно использовать не II, как на ресурсе, а III, т.е. Anova.clm(model, type = "III")

Использовал для анализа микробиологических данных с большим числом цензурированных наблюдений (ЦН). Клинические микробиологи не определяют концентрации микробов в этиологически незначимых концентрациях, т.е. обычно менее 10^4 или 10^5 не определяют, просто пишут что меньше этого числа. Считать такие данные критерием Манна - Уитни или Краскелла - Уоллиса - без проблем, можем заменить ЦН на любое самое маленькое число - такие ЦН получат в анализе минимальный ранг (или минимальный средний ранг если таких в наборе данных несколько). А вот в двухфакторном анализе аналогичное получилось сделать только сейчас.

Если кто-то имеет опыт использования порядковой регрессии - делитесь, особенно интересуют сложные mixed модели/

Сообщение отредактировал nokh - 3.09.2024 - 21:40
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему