Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> Критерий Краскела-Уоллиса для сравнения двух групп на трех визитах
Varta
сообщение 29.06.2023 - 20:04
Сообщение #1





Группа: Пользователи
Сообщений: 20
Регистрация: 29.10.2008
Из: Челябинск
Пользователь №: 5459



Здравствуйте уважаемые участники форума!

В одной статье мне встретилось следующее: имеем две группы пациентов, каждая из которых обследована на 3 визитах. Пациенты на визитах строго одни и те же, то есть по логике самым простым должно быть сравнение групп между собой на 1, 2 и 3 визитах с помощью критерия Манна-Уитни, и сравнение динамики внутри групп 1 визит---2 визит --- 3 визит с помощью критерия Фридмана с дальнейшим попарным сравнением с поправкой на множественные сравнения. Если есть желание избежать ошибки множественных сравнений на визитах, то проводится одномерный анализ повторных измерений с установлением влияния временного фактора, фактора группы и наличие их взаимодействия (непараметрического аналога данного анализа я не знаю, если подскажете. буду благодарна)

В статье было указано, что анализ проведен с помощью критерия Краскела Уоллиса с поправкой на множественность сравнений с помощью программы Prism. И далее на графиках имели место звездочки для сравнения двух групп на каком-либо визите, либо для сравнения динамики между визитами внутри какой-либо из групп.
Это правильная процедура для анализа? У меня было предположение, что это попытка избежать ошибки множественных сравнений путем того, что мы все 6 точек считаем отдельными выборками, но там же как связанные, так и не связанные данные. Я не вижу нигде в доступных мне источниках упоминание о каком-то варианте критерия Краскела-Уоллиса, который использовался бы как аналог одномерного анализа повторных измерений.

Заранее спасибо за ответ.

Прогуглила форум и в одном из тредов нашла мнение 100$ по похожему случаю (критерий Крускела применять некорректно)
http://forum.disser.ru/index.php?showtopic=1246&st=30
Это интерлейкины, их очень сложно привести в нормальное распределение, кроме того три точки нелинейны, это уровень ИЛ до воздействия, на фоне воздействия, после окончания. Соответственно связь с лечением будет только в одной точке - втором визите, как бы не получилось, что эти различия будут проигнорированы при анализе повторных измерений

Сообщение отредактировал Varta - 29.06.2023 - 20:58
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 30.06.2023 - 06:26
Сообщение #2





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Varta @ 29.06.2023 - 21:04) *
... о каком-то варианте критерия Краскела-Уоллиса, который использовался бы как аналог одномерного анализа повторных измерений.

Критерий Шейрера-Рэя-Хэйра можно посмотреть. Описание Sokal R.R., Rohlf F.J. Biometry: The principles and practice of statistics in biological research.

Сообщение отредактировал Игорь - 30.06.2023 - 10:09


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ИНО
сообщение 30.06.2023 - 20:19
Сообщение #3





Группа: Пользователи
Сообщений: 204
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



Тут много чего можно применить, но вопрос зачем, в смысле какова задача? Определить, на каком из визитов между двумя группами появляется статистически значимая разница? Или надо отловить разницу внутри каждой из групп от визита к визиту? Или вес и сразу с блэкджеком и шлюхами?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 1.07.2023 - 09:56
Сообщение #4





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Имеем две группы на разных сроках. Соответственно применить критерий КУ для анализа всех данных просто не получится: это ранговый аналог однофакторного дисперсионного анализа, т.е. применяется для сравнения нескольких независимых выборок. В вашем случае независимыми являются 2 группы на каждом из сроков. На разных же сроках выборки являются зависимыми, а для зависимых выборок можно использовать ранговый критерий Фридмана, но только для какой-то одной из двух выборок))) Апостериорные сравнения внутри критерия Фридмана можно провести специальными ранговыми методами, но таким образом вы сможете доказать собственно наличие какой-то динамики в каждой из групп в отдельности, но не сравнить эти динамики между собой. Классическим методом для вашего случая является дисперсионный анализ (ANOVA), в котором можно задать как независимость групп (фиксированный фактор "Группа"), так и учесть зависимый характер наблюдений на разных градациях фиксированного фактора "Срок". В пакетах это делается двумя технически разными методами, но которые дают одинаковый численный результат. Первый - двухфакторный анализ повторный измерений (факторы: "Группа" и "Срок"), второй - трёхфакторный дисперсионный анализ с фиксированными факторами "Группа" и "Срок" и случайным фактором "Пациент внутри Группы". Это нужно правильно задать в пакетах, но учитывая, что сравнение в динамике - один из самых популярных методов в медицине, примеры легко найти. Пакет Prizm серьёзный, с хорошим руководством, если пользуетесь им, то там обязательно описано. У этих двух подходов разные теоретические предпосылки, поэтому и разные требования к данным, наряду с требованием нормальности распределения ошибки модели, первый требует сферичности и использует разные модификации в случае нарушения требования, второй требует однородности дисперсий в ячейках дисперсионного комплекса. Апостериорные сравнения в рамках дисперсионных комплексов проводятся обычными для дисп. анализа методами (выбор большой).

К сожалению, рангового аналога для такого анализа нет, иначе это был бы один из самых известных критериев. Поэтому можно использовать преобразование исходных данных, для того чтобы нормализовать ошибку анализа. Лучший вариант - преобразование Бокса - Кокса (Box-Cox transformation), которое подожмёт хвосты положительно асимметрично распределённых итнерлейкинов и позволит использовать описанные модели ANOVA. Есть варианты его применения, но самый простой - просто трансформировать всю колонку данных и выписать значение параметра "лямбда" (оно может понадобиться для ретрансформации средних с 95% ДИ на графиках). Скорее всего для большинства интерлейкинов лямбда у вас будет близка к 0 (ноль), а это значит что распределение близко к логарифмически нормальному. Если так, то самый простой вариант будет просто прологарифмировать колонку данных; так данные будут хуже приближены к требованиями модели, но зато проще строить графики в логарифмическом масштабе. Если заморочиться, можно проверить на нормальность ошибку дисперсионного комплекса. Преобразование БК на форуме много обсуждалось, легко делать, в том числе в бесплатных пакетах.

В рамках описанного подхода самым интересным для вас будет взаимодействие факторов "Группа х Срок", которое и оценивает различие динамик между группами. Соответственно апостериорные сравнения важнее сделать для ячеек этого эффекта.

Сообщение отредактировал nokh - 1.07.2023 - 09:58
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
comisora
сообщение 1.07.2023 - 13:25
Сообщение #5





Группа: Пользователи
Сообщений: 95
Регистрация: 27.12.2015
Пользователь №: 27815



2 Varta

В Вашем случае можно использовать порядковую регрессию со смешанными эффектами, так как данная модель обобщает критерии Манна-Уитни и Краскела-Уоллиса. Попробуйте программу Jamovi и модуль GAMLj к ней.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ИНО
сообщение 1.07.2023 - 22:45
Сообщение #6





Группа: Пользователи
Сообщений: 204
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



Цитата(comisora @ 1.07.2023 - 13:25) *
В Вашем случае можно использовать порядковую регрессию со смешанными эффектами

А, она там, по ссылкам, точно есть? Я очень коротко пробежался, так что, вполне вероятно, мог что-то упустить, но в первой, где код R, не заметил ничего смешанного, а во второй, где окошки неведомой мне программулины, - ничего порядкового. А так-то да, неплохо было бы их между собой поженить, и, наверное, это уже кто-то сделал.

Но почему именно порядковая? ТС скромно умолчал о шкале измерения. Быть может, там что-то вполне себе количественное.

Сообщение отредактировал ИНО - 1.07.2023 - 22:49
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 2.07.2023 - 07:52
Сообщение #7





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Возможно ошибаюсь, в задаче вижу две многомерных выборки (каждый объект описан вектором параметров). Поэтому, если речь о многомерном расширении Краскела-Уоллиса, как просил автор темы, в дополнение к указанной выше еще вот эту работу можно посмотреть Scheirer C.J., Ray W.S., Hare N. The analysis of ranked data derived from completely randomized factorial designs // Biometrics, June 1976, vol. 32, no. 2, pp. 429-434. Также можно посмотреть критерий Пури-Сена-Тамура. См. Tamura R. Multivariate nonparametric several-sample tests // The Annals of Mathematical Statistics, June 1966, vol. 37, no. 3, pp. 611-618 и Pontes A.C.F. Analise de variancia multivariada com a utilizacao de testes nao-parametricos e componentes principais baseados em matrizes de postos. - Sao Paulo: Paracicaba, 2005. На русском см. книгу Родионов Д.А. Справочник по математическим методам в геологии / Д.А. Родионов, Р.И. Коган, В.А. Голубева и др. - М.: Недра, 1987. Есть и другие критерии, но они требуют многомерной нормальности. Реализации всех методов есть в ПО AtteStat (документация по методам на сайте, посвященном ПО ME.com).
Конечно, можно рассмотреть задачу с точки зрения динамики, как предлагают коллеги.

Дополнение к источникам. О многомерных методах см. также главу 5 книги Родионов Д.А. Статистические решения в геологии. - М.: Недра, 1981.

Сообщение отредактировал Игорь - 6.07.2023 - 19:27


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 2.07.2023 - 16:37
Сообщение #8





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Один фактор "Группа" - межгрупповой (Between) с фиксированным эффектом, Второй фактор "Время" - внутригрупповой (Within) с фиксированным эффектом.
В итоге имеем т.н. split - plot disign.

Nokh прав: такой дизайн нельзя не узнать.

Непараметрических аналогов не существует.
Поэтому придется делать параметрический ANOVA.

Однако, как правило, измеряют сразу несколько интерлейкинов/цитокинов, поэтому, может и split-plot MANOVA замаячить...

Критерий Шайрера - Рэя - Хейра не подойдет, поскольку не работает с within-эффектами, т.е. непригоден для анализа связанных выборок.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
comisora
сообщение 2.07.2023 - 19:13
Сообщение #9





Группа: Пользователи
Сообщений: 95
Регистрация: 27.12.2015
Пользователь №: 27815



2 ИНО

Как я понял, нужно выбрать тип распределения для categorical depended variable, раскидать по нужным полям фиксированные и случайные эффекты и попытаться запустить модель. Однако это может не сработать так как распределения предназначены(?) для моделирования дихотомических переменных. Можно выкрутиться, если знать условные нормы для интерлейкинов или разбить данные на интересующие области, хотя дихотомизация не всегда удачный выбор для анализа.

На мой взгляд, порядковая регрессия является способом решения данной задачи, так как все интервальные переменные - это порядковые данные (обратное, разумеется, не только лишь верно). В данной публикации рассмотрен пример моделирования клеток CD4 при ВИЧ-инфекции (настоящие дискретные количественные данные). Чем непараметрический аналог параметрической ANOVA с повторными измерениями?

Раз 100$ затронул MANOVA, то приведу ссылку на реализацию, которая не требует специальных допущений, что в случае с интерлейкинами выглядит неплохо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ИНО
сообщение 2.07.2023 - 20:34
Сообщение #10





Группа: Пользователи
Сообщений: 204
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



Цитата(comisora @ 2.07.2023 - 19:13) *
2 ИНО

Как я понял, нужно выбрать тип распределения для categorical depended variable


Не уверен: выделенное скорее похоже на неупорядоченный мультиномиальный отклик, чем на порядковый, это разные вещи. Вообще, порядковая регрессия, та что по-буржуйски зовется "ordinal" даже без смешанных эффектов - не самая простая штука. Обычно применяют proportional odds модель (переводить специально не стал - Игорь с этим правится лучше), за неимением иных в большинстве ПО. Фрэнк Харрел утверждает, что это по сути тот же К-У, только в профиль. Но она далеко не всегда соответствует данным, по этому есть куча "непропорциональных" альтернатив. В них больше степеней свободы, оттого меньше мощность, зато больше гибкость. Но в упор не вижу, зачем вдавится в эти изыски в случае количественного отклика.

Ежели, как переложил Игорь, рассматривать отклик как многомерный, то есть же db-perMANOVA. Хотя и подвергнута критике за недостаток мощности, но всяк лучше для "некрасивых" данных, чем сферическая в вакууме MANOVA. Или вообще ограничиться ординацией. А еще можно отклик каждого пациента рассматривать как функцию от времени (в данном случае - от количества сеансов), и тогда путь лежит в область FDA. А еще... А еще с этими данными можно проделать дофига разных вещей, знать бы только цель и задачи... Ситуация во многом противоположна той, где надо было сравнить хоть как-то две выборки, каждая объемом в шиш с маком, когда найти хотя бы один приемлемый статистический критерий оказалось невыполнимой миссией.



Сообщение отредактировал ИНО - 2.07.2023 - 20:50
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Varta
сообщение 6.07.2023 - 14:23
Сообщение #11





Группа: Пользователи
Сообщений: 20
Регистрация: 29.10.2008
Из: Челябинск
Пользователь №: 5459




Игорь, ИНО, nokh, 100$, comisora - огромное спасибо за ответы. Отдельное спасибо за "К сожалению, рангового аналога для такого анализа нет, иначе это был бы один из самых известных критериев." Это ситуация воспроизводится в 90% медицинских исследований и все время было ощущение, что ты чего-то не знаешь, раз такой базовый дизайн, а как его анализировать непараметрикой непонятно.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ИНО
сообщение 7.07.2023 - 16:42
Сообщение #12





Группа: Пользователи
Сообщений: 204
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



Вместо благодарностей все ж хотелось бы услышать конкретику о шкале измерения этих ваших попугаев. А то очень может быть, что ранговые критерии Вам нафиг не уперлись.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 7.07.2023 - 18:07
Сообщение #13





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(ИНО @ 7.07.2023 - 16:42) *
Вместо благодарностей все ж хотелось бы услышать конкретику о шкале измерения этих ваших попугаев. А то очень может быть, что ранговые критерии Вам нафиг не уперлись.


Вам до такой степени лень загуглить? Что-нить типа "интерлейкин ИЛ-18"? Измеряется обычно в пг/мл, может быть в нг/ммоль креатинина, т.ч. шкала там не ниже интервальной.
Распределение, как правило, к нормальному не имеет отношения, тем паче к многомерному нормальному.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ИНО
сообщение 8.07.2023 - 12:04
Сообщение #14





Группа: Пользователи
Сообщений: 204
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



А фиг его знает, в чем они этот ИЛ измеряют, может вообще в звездочках, или вообще <х или >х. Если посмотреть выдачи результатов анализов всяких-разных коммерческих лабораторий, то там каких только попугаев не встретишь!

Сообщение отредактировал ИНО - 8.07.2023 - 12:09
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 10.07.2023 - 07:41
Сообщение #15





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



> Varta. См. личное сообщение.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему