![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Наконец-то нашёл ранговую замену (функциональный аналог) многофакторному дисперсионному анализу - порядковую регрессию.
Как считал раньше. 1) Если данные - полноценные количественные показатели (в биологии и медицине такие признаки имеют чаще ненормальное распределение разной степени асимметрии) , то можно использовать нормализующее преобразования Бокса - Кокса, а далее использовать классические модели дисперсионного анализа. Существуют способы сделать разные варианты преобразования Бокса-Кокса: можно для всего набора целиком (без учёта групп, подгрупп), можно с учётом групп, можно также с учётом как нормализации распределения ошибки, так и с учётом требования равенства дисперсии в группах/подгруппах, можно даже многомерное (для любителей MANOVA)... Всё это обсуждалось на этом форуме, давались ссылки на пакеты вне среды R, которые преимущественно уже устарели. Я последнее время не парился: делал преобразование для всего массива данных, а после anova смотрел распределение ошибки: чтобы визуально более-менее симметрично было. 2) В некоторых случаях вместо двухфакторного анализа использовал ранговый критерий Фридмана. Это - ранговый аналог однофакторного дисперсионного анализа с повторными наблюдениями или двухфакторного дисперсионного анализа с рандомизированными блоками. Приходилось считать 2 варианта: с использованием групп как факторов (внутриблоковая изменчивость выступает ошибкой) и с использованием блоков как второго фактора (внутригрупповая дисперсия по первому фактору выступает ошибкой). Критерий также неоднократно обсуждался на форуме. В рамках критерия Фридмана возможно проведение апостериорных сравнений, а по его результатам удобно рассчитывать коэффициент конкордации Кендалла - прямо из статистики хи-квадрат. Минусы такого подхода - это неполноценная замена двухфакторному дисперсионному анализу, т.к. невозможно оценить взаимодействие факторов: для двухфакторного anova с единственным наблюдением на ячейку комплекса проверку на взаимодействие можно провести косвенно - тестом Тьюки на неаддитивность, а как сделать подобное для Фридмана - не знаю. Также если факторов больше двух - критерий неприменим. Как можно сейчас. Ранжируем все наблюдения без учёта групп/подгрупп и проводим порядковую регрессию с использованием факторов в качестве регрессоров. Насколько понял посмотрев по диагонали, это что-то вроде общих линейных моделей, которые почти полностью вытеснили классический дисперсионный анализ. А значит возможно включение в модель не только взаимодействий, но и вложенных эффектов. Короче, полноценный ранговый функциональный аналог general linear models. Знакомство можно начать отсюда: https://rcompanion.org/handbook/G_01.html Примеры есть на этом же ресурсе, я использовал этот пример: https://rcompanion.org/handbook/G_11.html Только тип ошибки в общем случае нужно использовать не II, как на ресурсе, а III, т.е. Anova.clm(model, type = "III") Использовал для анализа микробиологических данных с большим числом цензурированных наблюдений (ЦН). Клинические микробиологи не определяют концентрации микробов в этиологически незначимых концентрациях, т.е. обычно менее 10^4 или 10^5 не определяют, просто пишут что меньше этого числа. Считать такие данные критерием Манна - Уитни или Краскелла - Уоллиса - без проблем, можем заменить ЦН на любое самое маленькое число - такие ЦН получат в анализе минимальный ранг (или минимальный средний ранг если таких в наборе данных несколько). А вот в двухфакторном анализе аналогичное получилось сделать только сейчас. Если кто-то имеет опыт использования порядковой регрессии - делитесь, особенно интересуют сложные mixed модели/ Сообщение отредактировал nokh - 3.09.2024 - 21:40 |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 107 Регистрация: 27.12.2015 Пользователь №: 27815 ![]() |
Порядковая регрессия - штука очень удобная. Я как-то задавал вопросы по её использованию в контексте дисперсионного анализа и рекомендовал к применению.
Чем хороша порядковая регрессия? Данная модель является обобщением критериев Манна-Уитни, Краскела-Уоллиса. С помощью неё можно моделировать непрерывные данные, что может быть актуально при решении определенных задач. Так как очень много чего оценивается в баллах и их анализ как непрерывных величин может оказаться плохой идеей, то именно порядковая регрессия является естественным выбором для такого набора данных, причём разработаны варианты даже для таких случаев, как визуально-аналоговая шкала, которая исходно обладает свойством эквидистантности, но успешно игнорируется в психических процессах. Этот вариант близок к задаче анализа суммарных баллов. По опыту использования могу сказать следующее. Самым простым в использовании пакетом является ordinal, в котором нет функции predict! из коробки для смешанной модели. С моделированием прекрасно справляются пакеты tram и tramME, но без поддержки emmeans делать парные и прочие сравнения, лично мне, сложноватно. Библиотекой GLMMadaptive пользовался пару раз, чем не зашла - не вспомню, но общее впечатление оставила благоприятное. Ещё пользовался mgcv, всё хорошо, кроме достаточно замысловатого синтаксиса и отсутствием возможности получать "усредненный балл" так, как это есть в ordinal и tram библиотеках. Поэтому приходится возиться, особенно с расчётами доверительных интервалов. И, наконец, brms и rstanarm - выбор для тех, кто хочет байесовских моделей. Необходимо потратить время на настройку и расчеты, но это не тоже самое, что потратить время на изучение Stan. У меня прилично публикаций, где я использовал именно порядковую регрессию, которые обусловлены спецификой работы с баллами. В отечественной и зарубежной литературе, на мой взгляд, этому вопросу уделяется недостаточное внимание вплоть до рекомендаций выполнять анализ "как обычно". Особенно это видно по тем работам, где на основании результатов тестов Шапиро-Уилка делают глубокомысленные заключения об "отсутствия нормальности". Сама модель измерения и порождения данных мало кого смущает ![]() |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 262 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 ![]() |
Только модели этих регрессий разные бывают. Некоторые опираются на допущение о пропорциональности шансов (или что-то в этом роде, не уверен что правильно вспомнил название), другие - нет, выводы получаются принципиально разные.
|
|
![]() |
![]() |
![]() ![]() |