Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: дисперсионный анализ повторных измерений
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
mamalita
Добрый день! Кратко изложу суть исследования. Исследуем две группы один вид хирургического лечения - основная группа (n=48), другой вид - контрольная группа (n=55). В обеих группах исследуем качество жизни по шкале FACT-L до операции, через 3, 6, 9 и 12 месяцев после операции - 8 показателей на каждый период. Количество больных с течением времени сокращается 3 месяца 47 и 53 человека, 6 месяцев - 46 и 52, 9 - 45 и 50 человек, 12 - 44 и 46 человек. Программа Statistica 6. Распределение показателей качества жизни отличается от нормального. Поэтому анализ проводила непараметрический.С помощью критерия Манна-Уитни до операции все 8 показателей статистически значимо не отличаются, что собственно нам и было нужно. Попарно сравнивала между собой каждый показатель из 8 на каждый промежуток времени, чтобы доказать что качество жизни в основной группе выше на данный промежуток времени, чем в контрольной (или нет, как получалось). Ранговый ДА Фридмана и конкордации Кенделла использовала для каждой группы отдельно для оценки в динамике. р<0,001. А дальше как? сравниваем критерием Вилкоксона попарно до операции-через 3 месяца, через 3 месяца - через 6 месяцев и т.д.? Нужна ли поправка Бонферони? Основной вопрос такой: правильно ли я делала? Можно ли использовать дисперсионный анализ для повторных измерений? (я попробовала его сделать, там где различия для непараметрического метода были значимы, стали в ДА не значимы, с чем это связано?) Еще прочитала что если распределение отличается от нормального, дисперсии не равны можно воспользоваться модулем GLM - так ли это (результаты в нем получились в точности такие же как RM-ANOVA. Помогите как правильно сделать.
nokh
Полного непараметрического аналога RM-ANOVA нет, поэтому видится 2 пути, которыми вы собственно и идёте.
1). Попарные сравнения. На каждом сроке: группу - с группой (Манн - Уитни), для каждой группы: срок с последующим (Вилкоксон для разностей пар). Бонферрони просится. Если различия высоко статистически значимы - поправка не страшна. Если же нет - вообще всё может свести на нет. Но в любом случае в такой схеме теряется информация о различиях динамик. В дисперсионном анализе всех данных она бы вышла в виде взаимодействия факторов Группа х Срок. Нужно ли пытаться её достать - вам виднее, но скорее всего - ДА.
2). Дисперсионный анализ. Пакет Statistica не позволит обработать все ваши данные, т.к. это дисперсионный комплекс с пропусками: раз люди терялись в ходе эксперимента - в схеме с повторными измерениями появятся пропущенные ячейки. В принципе такой комплекс тоже можно обработать грамотно, но для этого нужен другой софт и знания, которыми я не обладаю (да и единства подхода в такой ситуации нет: различные схемы модифицированного расчёта сумм квадратов отклонений, импутация пропущенных значений). Если исходить из того что есть, нужно обрезать материал - я бы так и сделал. Т.е. оставлять в анализе только тех людей, данные по которым есть для всех сроков. Ваша ситуация не "аховая": не так уж много потерялось. Полагаю, что выигрыш в мощности от совместного анализа максимально возможного количества данных с лихвой окупит такую потерю.
GLM - это обобщение дисперсионного и регрессионного анализов, т.е. параметрическая техника, а значит должна быть нормальность (но не исходных данных, а остатков). Если окажется, что они распределены ненормально - не страшно: можно преобразовать исходные данные - этой теме не форуме уделялось много внимания.
Итак, в рамках такого подхода факторы будут: Группа (фиксированный), Срок (фиксированный) и Индивид внутри Группы (случайный, обозначается так: Индивид (Группа)). Т.е. имеем смешанную модель трёхфакторного дисперсионного анализа с пересекающимися и иерархическими факторами. В ходе дисперсионного анализа в модуле GLM оцениваться будут следующие эффекты:
Группа
Срок
Индивид (Группа)
Взаимодействие Группа х Срок
Взаимодействие Срок х Индивид(Группа)
В Statistica важно не забыть отметить на вкладке случайный фактор, а также нужно верно задать иерархический фактор Индивид (Группа) и взаимодействие Срок х Индивид(Группа) - описывать долго, проще "методом тыка". Попробуйте. Кое-что полезного можно найти здесь:
http://forum.disser.ru/index.php?showtopic...D1%8C&st=15 (сообщение 16).
sandy
А что если Вам попробовать Краскелла-Уоллиса для разных сроков (3-6... месяцев)? Выборка будет незначительно уменьшаться из-за выбывание пациентов, но это не страшно в Вашем случае. Вы сможете также посмотреть конвергентность-дивергентность отличий во времени.
mamalita
Уважаемый Nokh, спасибо, что откликнулись. Не умею делать вставки из ваших цитат. Поэтому спрошу по пунктам
1. почему при непараметрическом применении теряется информация о различии динамик. Нас же не интересует например отличались ли показатели в основной группе через 3 месяца от показателей в контрольной через 9?
2. Т.е. не смотря на ассиметричное распределение я могу применить ДА с обрезанным материалом (очень хочется сделать именно так, потому что нагляднее и проще)? Потом отдельно сравнивать с помощью анализа контрастов? Тут еще проблема появилась, при построении графиков с 95%-ДИ видно что различия не должны быть значимыми а при непараметрическом р=0,000, и при ДА р<0,05. Что бы это могло быть?
3. Попробую разобраться с GLM - для этого нужно время. Думаю вопросы по этому аспекту еще появятся.

Вопрос к Sandy - что вы подразумеваете под конвергентностью и дивергентностью отличий во времени ? Спасибо.
sandy
Различия могут увеличиваться с течением времени, могут уменьшаться. Возможно, что через три месяца их еще не будет "видно". Или через 12 месяцев уже не будет видно. Кстати, для Краскелла-Уоллиса поправка Бонферонни не нужна.
nokh
Цитата(sandy @ 28.03.2011 - 13:55) *
А что если Вам попробовать Краскелла-Уоллиса для разных сроков (3-6... месяцев)? ...

Критерий Краскела-Уоллиса не подойдёт: он для независимых выборок, а здесь выборки зависимые.
nokh
Цитата(mamalita @ 28.03.2011 - 16:30) *
1. почему при непараметрическом применении теряется информация о различии динамик. Нас же не интересует например отличались ли показатели в основной группе через 3 месяца от показателей в контрольной через 9?

Не при непараметрическом, а при попарном. Различия в форме динамик в принципе возможно обнаружить только при анализе всего материала целиком. А при попарных сравнениях сравниваются только какие-то 2 группы. Даже если вы нарисуете 2 различные кривые динамики и на каждом кусочке докажете, что группы различались это не докажет, что различался характер динамик.
Цитата(mamalita @ 28.03.2011 - 16:30) *
2. Т.е. не смотря на ассиметричное распределение я могу применить ДА с обрезанным материалом (очень хочется сделать именно так, потому что нагляднее и проще)? Потом отдельно сравнивать с помощью анализа контрастов?

Да
Цитата(mamalita @ 28.03.2011 - 16:30) *
Тут еще проблема появилась, при построении графиков с 95%-ДИ видно что различия не должны быть значимыми а при непараметрическом р=0,000, и при ДА р<0,05. Что бы это могло быть?

Возможны 2 причины, в зависимости от того, про какие сравнения вы говорите: независимых или зависимых групп. Если независимые, то это потому, что при расчёте ДИ используется только информация о каждой выборке по отдельности. При совместном анализе ошибка уменьшается, мощность сравнения увеличивается и группы могут различаться несмотря на перекрытие ДИ. А в случае зависимых выборок ДИ вообще ни о чём не скажут, тк.к. в этом случае правильной мерой оценки различий будет не среднее, а разность "до-после" с ДИ для неё. Например, если у 5 пациентов "до" было: 1, 10, 100, 200 и 1000, а "после" стало 2, 11, 101, 201 и 1001, то несмотря на почти идентичные ДИ, различия будут высоко статистически значимыми, т.к. во всех случаях разность составила единицу, а в анализе (см. тесты Уилкоксона для разностей пар, парный критерий Стьюдента, критерий знаков) будет анализироваться именно она, а не вся внутригрупповая изменчивость .

sandy
как я понял - выборки независимые. Если ошибся - извините. Насколько я понимаю, Манна-Уитни применяется при независимых выборках... Если выборки зависимые, то ранговый Фридман (ANOVA) и тоже Бонферонни не понадобится. Честно говоря, как-то от меня ускользнула постановка задачи... Что с чем сравнивается и что нужно показать/доказать.
sandy
To nokh: Извините, только что дошло, что Вы имели в виду зависимость из-за повторных измерений. Я имел в виду анализ данных по временному срезу - там обе выборки независимые.

To Mamalita: Только мне осталось непонятно, чем они должны отличаться, если вид операции один и тот же - были различия в терапии?
DrgLena
To sandy: поясните, пожалуйста вашу позицию по поводу поправки Бонферрони при парных сравнениях после Фридман ANOVA. Вы предпочитаете другие тесты для парного сравнения или считаете, что для непараметрики не существует проблемы множественного сравнения. Если можно, обоснуйте со ссылками.
sandy
Цитата(DrgLena @ 29.03.2011 - 13:09) *
поясните, пожалуйста вашу позицию по поводу поправки Бонферрони при парных сравнениях после Фридман ANOVA. Вы предпочитаете другие тесты для парного сравнения или считаете, что для непараметрики не существует проблемы множественного сравнения.


Насколько я понимаю, это метод для множественных сравнений, а не попарных, как Уилкоксон.
sandy
Цитата(DrgLena @ 29.03.2011 - 13:09) *
Если можно, обоснуйте со ссылками.

Извините, ссылочку забыл http://en.wikipedia.org/wiki/Friedman_test
mamalita
Sandy: группы разные - основная - новый метод операции, контрольная - уже давно применяющийся.
Nokh: самый главный ответ я получила - ДА можно и график меня смущать не должен, потому что действительно на нем перекрываются интервалы между группами.
"Даже если вы нарисуете 2 различные кривые динамики и на каждом кусочке докажете, что группы различались это не докажет, что различался характер динамик." - а как сравнить эти кривые? В целом качество жизни повышалось в обеих группах, но в основной - быстрее и выше. Так было у большинства больных, но есть еще больные у которых после лечения возникли рецидивы (некоторые умерли за период наблюдения) - у них соответственно снижалось. Их я хотела сравнивать вторым этапом - тоже ДА фактор: был или не было рецидива. Но может быть тогда имеет смысл делать все в целом?
sandy
Mamalita, если Вы ставите задачу не только проверить гипотезу о различии двух групп, но изучить "динамику" переменных, то, возможно, возникнет ситуация, когда разные факторы в разные периоды времени будут влиять по-разному. Например, исследуется влияние внутричерепной гипертензии после ЧМТ на летальность и тяжесть исходов. Оказывается, что ВЧД (внутричерепное давление) незначительно влияет на исходы в некоторый начальный период просто потому есть более "быстрые" факторы, к тому гипертензия не всегда успевает развиться так быстро из-за компенсаторных механизмов. Но спустя некоторое время ВЧД становится одним из ключевых факторов.
Картину можно понять, если сделать факторный анализ для каждой группы измерений в разные моменты времени - главные факторы будут отличаться по структуре и вкладу в объяснение вариативности.

Другой пример - повторный разрыв церебральной аневризмы. Временное распределение было тримодальным, действовали три разных механизма развития осложнения. Решение было в дискриминации больных по трем классам, чтобы оценить риски повторного разрыва на каждой стадии.

Другими словами, подумайте над постановкой задачи. Что именно Вы хотите - проверить гипотезу, изучить различия в динамике, интерпретировать эти различия, прогнозировать? Это будет 90% успеха. Есои просто хотите сравнить исходы, то просто проверьте гипотезу по данным последнего срока. Можно использовать дихотомию, ввести порог "качества жизни" и сравнить пациентов из двух групп. Спасибо.
DrgLena
Цитата(sandy @ 29.03.2011 - 14:17) *
Насколько я понимаю, это метод для множественных сравнений, а не попарных, как Уилкоксон.

Очевидно, не понимаете. Если с помощью критерия Фридмана вы нулевую гипотезу отвергли, то остается неизвестным между какими именно временными точками различия статистически значимы. Дочитайте свою ссылку до конца узнаете про post hoc, в каких программах какие методы реализованы, чтобы не использовать Боферрони. На этом форуме nokh также предлагал другие методы и обсуждались ситуации, когда удобно использовать и Бонферрони.
sandy
Цитата(DrgLena @ 29.03.2011 - 20:29) *
поясните, пожалуйста вашу позицию по поводу поправки Бонферрони при парных сравнениях после Фридман ANOVA...

Очевидно, не понимаете. Если с помощью критерия Фридмана вы нулевую гипотезу отвергли, то остается неизвестным между какими именно временными точками различия статистически значимы. Дочитайте свою ссылку до конца узнаете про post hoc, в каких программах какие методы реализованы, чтобы не использовать Боферрони. На этом форуме nokh также предлагал другие методы и обсуждались ситуации, когда удобно использовать и Бонферрони.


Извините, но на мой взгляд, не понимаю не я. smile.gif Метод Фридмана метод множественных сравнений. Вы писали о парных. То, что существуют другие методы - замечательно, но речь в данном случае шла конкретно об этом методе. Если стоит задача проверки гипотезы, то он применим. Поправка для него не нужна. Вэтом был вопрос. И при чем к нашему вопросу post hoc?
DrgLena
Nokh: поправка Бонферрони просится.
Sandy: Кстати, для Краскелла-Уоллиса поправка Бонферонни не нужна.
Sandy: Фридман (ANOVA) и тоже Бонферонни не понадобится

Это Ваши высказывания и я просила их обосновать со ссылками. Если вы проводите параметрический дисперсионных анализ 5 групп и отвергаете нулевую гипотезу по критерию Фишера, вас интересует между какими именно группами имеются различия? Как вы поступаете дальше? Безусловно, поправка Бонферрони нужна для последующих множественных парных сравнений, если нет других тестов.
sandy
[
sandy
Цитата(DrgLena @ 29.03.2011 - 21:32) *
Nokh: поправка Бонферрони просится.
Sandy: Кстати, для Краскелла-Уоллиса поправка Бонферонни не нужна.
Sandy: Фридман (ANOVA) и тоже Бонферонни не понадобится

Это Ваши высказывания и я просила их обосновать со ссылками. Если вы проводите параметрический дисперсионных анализ 5 групп и отвергаете нулевую гипотезу по критерию Фишера, вас интересует между какими именно группами имеются различия? Как вы поступаете дальше? Безусловно, поправка Бонферрони нужна для последующих множественных парных сравнений, если нет других тестов.


Свои высказывания я обосновал ссылкой и прокомментировал. Посмотрите еще раз мои посты и свои. Метод Фридмана - непараметрический. :-) Зачем делать попарные сравнения в этом случае? Что Вы узнаете и как интерпретируете? Улучшаются или ухудшаются показатели с течением времени в двух группах? Нет, не узнаете. Этот подход здесь не годится.

Две группы, N измерений, какой характер динамики неизвестно (линейная, нелинейная). Существует определенная, "поступательная" логика анализа таких данных. Не стоит начинать с того какой метод применить, а надо поставить задачу. Если задача сравнить две группы по качеству жизни, то сравнить переменные в конце наблюдений. Если понадобится понять на каком сроке проявляются различия, можно поступательно проводить сравнения для двух групп на каждом сроке. Выборки не будут перекрываться, поправки не нужны. Если понадобится интерпретировать причину этих различий, то используйте факторный анализ. Каждая задача решается в ее контексте, метод выбирается под задачу с учетом его специфики и контекста задачи. Спасибо.
DrgLena
Цитата(sandy @ 30.03.2011 - 10:58) *
Если понадобится понять на каком сроке проявляются различия, можно поступательно проводить сравнения для двух групп на каждом сроке. Выборки не будут перекрываться, поправки не нужны.

И сколько сравнений вы должны будете сделать?
Именно это мне и непонятно.

nokh предложил параметрический ANOVA, я тоже сторонник такого подхода для различных шкал описывающих качество жизни. В одном комплексе будут проведены и проиллюстрированы графически все интересующие сравнения. И проблема множественных сравнений решается выбором соответствующих тестов.
В непараметрических аналогах ANOVA много чего не хватает, потому туда Бонферрони и просится.
sandy
Цитата(DrgLena @ 30.03.2011 - 14:33) *
И сколько сравнений вы должны будете сделать?
Именно это мне и непонятно.


Я бы сравнивал только "соседние" выборки по времени - насколько для нас важно отличаются ли состояния пациентов в первый период и последний? Насколько я понял, вопрос состоит в том, чтобы (1) выяснить различаются ли группы по исходам для двух типов лечения; (2) отличается ли динамика лечения в двух группах; (3) интерпретировать различия по 6 переменным. Но это, конечно, вопрос к автору темы smile.gif. Характер переменных неизвестен. Предполагаю, что часть их порядковые или номинальные.

Если мы создадим общую выборку, то, конечно, она окажется достаточно большой для применения параметрических методов, но ведь тогда мы похороним там информацию о том в какие периоды делались наблюдения. Или я ошибаюсь?

Абсолютно согласен, что Фридман гораздо беднее параметрического ANOVA. Но для выборки из 48 пациентов...
DrgLena
Цитата(sandy @ 30.03.2011 - 21:15) *
Я бы сравнивал только "соседние" выборки по времени - насколько для нас важно отличаются ли состояния пациентов в первый период и последний?

Автор поста вполне внятно изложила цель ? сравнить качество жизни в двух группах в каждой исследовательской точке. В одной группе качество жизни может статистически значимо повыситься через 6 мес после вмешательства, а в другой только через 12 мес. Или, различия между группами могут отсутствовать через 3 месяца после вмешательства, но появиться и сохраняться в последующем через 6 мес.
Цитата(sandy @ 30.03.2011 - 21:15) *
Если мы создадим общую выборку, то, конечно, она окажется достаточно большой для применения параметрических методов, но ведь тогда мы похороним там информацию о том в какие периоды делались наблюдения. Или я ошибаюсь?

Ошибаетесь, ничего не похороним, почитайте подход, описанный nokh
sandy
Цитата(DrgLena @ 30.03.2011 - 23:11) *
Ошибаетесь, ничего не похороним, почитайте подход, описанный nokh


Спасибо, почитаю.
mamalita
Я пришла к выводу, что не могу обрезать данные, т.к. большинство выбывших - умерли, а перед этим у них качество жизни ухудшалось и параллельно был выявлен рецидив, в отличие от остальных. Значит все-таки непараметрика, или в качестве фактора добавить - возникновение рецидивов? Попробовала, По результатам ANOVA - есть отличия отдельно рецидивХповторностьХкачество жизни, отдельно группаХповторностьХкачество жизни, совместно для этих факторов различий нет - что в целом логично. Кстати шкала качества жизни - количественная.
для Nokh: в GLM - случаные события у меня не высвечивается, а результаты как в ДА повторных измерений.
Вообще я начала анализировать все отдельно, но если мыслить глобально, то хотелось бы создать модель (я описывала в предыдущем посте) где на входе переменными были например возраст, пол, стадия, степень дифференцировки, время с момента предыдущей операции, возможно КЖ до операции или в какие-то точки обследования а на выходе вероятность развития рецидива (летального исхода?). При чем чтобы это было обличено в доступную для практикующего врача таблицу. Исходя из моих неглубоких познаний я вижу логит-регрессию, где останутся только значимо влияющие факторы, а что потом? Читала о моделях Маркова и деревьях классификации, вопрос ко всем специалистам: как считаете - они подойдут? И можно ли ссылки на их описание и в каких программах делается и как?
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.