Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Дисперсионный анализ с повторными измерениями.
Alex_Z
сообщение 24.12.2011 - 00:23
Сообщение #1





Группа: Пользователи
Сообщений: 59
Регистрация: 23.12.2011
Пользователь №: 23383



Здравствуйте.

Кратко опишу проблему.
Имеются две группы больных 1 и 2. Отличаются тем, что в гр.1 применялся особый метод лечения. Имеем следующие переменные: группа (1/2), индексы АПАЧИ, СОФА и ССС до лечения, на первые сутки после лечения и на 5-е сутки (вроде, это интервальная шкала, т.е. только целые значения); исход на 30-е сутки (1-жив, 0-мертв). Объем выборок - по 60 человек на этапе "до лечения", позднее несколько испытуемых умерли.
Необходимо:
1. Установить исходное отсутствие статистически значимых различий между группами 1-2. Чтобы убедиться, что исходно различий в группах не было.
2. Оценить достоверность различий внутри групп по временным точкам - гр.1 - до, после, 5 сутки; и гр.2 - до, после, 5 сутки.
3. Сравнить достоверность различий между группами в разных временных точках.

Мне видится решение этой задачи так: проверка выборок на нормальность, оценка различий в дисперсиях. В случае двух групп - проверка отсутствия изначальных различий средних между группами кр.Стьюдента, а в случае трех и более групп - однофакторным дисперсионным анализом. Далее дисперисонный анализ с повторными измерениями: зависимая переменные - индексы шкал АПАЧИ, СОФА и ССС. Внутригрупповой фактор - время (3 уровня) и 2 межгрупповых фактора - группа (2 уровня) и исход (2 уровня).

Верен ли мой алгоритм? Может есть более простые/правильные способы?

Так же есть еще вопросы.

1. Обязательно создавать фактор "исход"? Допустимо ли изначально разбить не на 2, а на 4 группы и анализировать потом только с фактором группы (4 уровня). Т.е. 1 (процедура-выжил), 2 (процедура-умер), 3 (контроль-выжил), 4 (контроль-умер)?
2. Каким методом лучше оценивать динамику? Т.е. - если индексы изменились менее чем на Х едениц, то больные умирали.
3. В моем примере все три индекса высчитываются по шкалам. Шкалы оценивать, по-сути примерно одно и то же - степень нарушения различных систем. В связи с этим, индексы довольно тесно коррелируют между собой. Обязательно ли анализировать их одновременно или можно сделать три расчета - отдельный для каждой шкалы?

Спасибо.

Чуть не забыл - считать собираюсь в SPSS.

P.S. Пакет BioStat - это совсем несерьезно, да? Был опыт работы с ним, более доступен для понимания.

Сообщение отредактировал Alex_Z - 26.12.2011 - 21:05
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 26.12.2011 - 20:38
Сообщение #2





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



(1). Начну с конца. Когда я его смотрел его раннюю версию (года 2 назад) BioStat мне не понравился: полазил в нём минут 10 и снёс. Что представляет сейчас - не знаю. А SPSS - один из лидеров с хорошей историей (есть лидеры с тёмными пятнами в истории).

(2). Умерших я бы сразу исключил и оставил для другого анализа. Видимо здесь нужно использовать логистическую регрессию для прогноза летального исхода, но эта задача - творческая. Т.е. у неё нет строгого решения, возможны варианты. Я участвовал в решении подобной задачи, но работа "повисла". Остановились на том, чтобы для прогноза использовать разность между показателями на последних сроках перед выпиской пациента из отделения или летальным исходом. Для этого для всех показателей строили динамики на всём исследованном отрезке, пытались формализовать с клиницистом разумные сроки для прогноза, т.к. оказалось, что резкое изменение ряда показателей, позволяющее за 1-2 суток однозначно предсказывать смерть для врачей бесполезно: оно по сути только маркирует наступление смерти, но не позволяет уже никак повлиять на исход. С другой стороны, динамика других показателей была полезна для прогноза ещё за дней 5-10, но далеко не так однозначно. Учесть постоянно меняющееся лечение в зависимости от динамики пока даже не пытались, хотя у меня сложилось впечатление, что и без этой информации пытаться прогнозировать смысл есть. Показатели, про которые я пишу - это собственно исходные показатели, которые собираются для расчёта тяжести по шкалам, особенно - дыхательный индекс, САД, ЧСС, тромбоциты. Сами же шкалы (Apache II, SOFA, Ranson, SAPS) показали себя куда более слабыми предикторами: площадь под ROC-кривой для всех шкал была в диапазоне 0,69 - 0,75. Можете тоже сделать ROC-анализ, но если материала мало и задача прогноза не стоит - просто сравните доли летальных случаев в таблице сопряжённости.

(3). Дисперсионный анализ нужно проводить по каждой шкале отдельно, т.к. иначе запутаетесь во взаимодействиях, а у менее искушённых в статистике коллег просто мозг "вынесет" и кроме обоюдного раздражения ничего не будет.

(4). Алгоритм я бы наметил следующий.

Сообщение отредактировал nokh - 26.12.2011 - 20:53
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Alex_Z
сообщение 26.12.2011 - 21:19
Сообщение #3





Группа: Пользователи
Сообщений: 59
Регистрация: 23.12.2011
Пользователь №: 23383



2nokh - спасибо, что откликнулись!

чтобы для прогноза использовать разность между показателями на последних сроках перед выпиской пациента из отделения или летальным исходом

Я так раньше и делал. Дополнительно разбил группы на подгруппы в зивисимости от исхода. Между некоторыми подгруппами была отмечена достоверна разница. В результате можно было оценить прогноз, в зависимости от того, в какой интервал попадали показатели больного: более выраженная динамика, чем у выживших/ "пограничные" значения/ менее выраженная динамика, чем у умерших.

Проблема в том, что выборки, как мне кажется, недостаточно большие - 60-100 пациентов. Насколько достоверные данные я получу - пока не знаю. Вот и пытаюсь определиться с тем, как лучше разбить больных и какой метод лучше применить.

(4). Алгоритм я бы наметил следующий.

Очень жду!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 26.12.2011 - 21:24
Сообщение #4





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Использовать дисперсионный анализ (ДА). Более простые способы есть, но более правильные - уже вряд ли. Анализ будет сложнее чем просто с повторными измерениями (иерархический компонент модели). У вас также 2 группы и время (перекрестный эффект). Т.е. имеем почти самый сложный вариант ДА - перекрёстно-иерархическую модель, или по терминологии Монтгомери ("Планирование эксперимента и анализ данных") - с персекающимися и сгруппированными факторами (сложнее только модели с пропущенными ячейками).
Факторы:
1. "Индивид" внутри "Группы" - случайный (R ) фактор. Пишется "Индивид (Группа)"
2. "Группа" - фиксированный (F) фактор.
3. "Время" - (F).
Взаимодействия:
4. "Индивид (Группа)" х "Время". (R ). Показывает индивидуальные различия в динамиках. Сам по себе не интересен и нужен для грамотного расчёта других эффектов.
5. "Группа" х Время" (F). Значимость данного эффекта укажет на существование межгрупповых различий в динамике.

По идее, после проведения анализа нужно проверить предположения в основе модели: нормальность распределения ошибки и равенство дисперсий. Фокус в том, что в таком анализе конечной ошибки не будет smile.gif , т.к. измерения проводились однократно. Я в таких случаях поступаю так: провожу сперва более простой ДА, исключив фактор "Индивид (Группа)" - т.е. как будто в каждой ячейке комплекса были свои объекты (не учитываю зависимый характер выборок) и смотрю распределение остатков, иногда равенство дисперсий. Принимаю решение "необходимо ли преобразование данных", если нужно - преобразую данные, смотрю помогло ли и делаю окончательный корректный анализ как описал выше.

После анализа провести апостериорные (post-hoc) сравнения между интересующими ячейками (группы на разных временных точках, включая точку "до лечения". Смотрю двумя методами:
Что значимо по Тьюки (Tukey HSD) - однозначно значимо,
Что не значимо по Фишеру (Fisher LSD) - однозначно незначимо,
Что незначимо по Тьюки, но значимо по Фишеру - тенденция к различиям. Аспирантам чаще больше нравится Фишер, т.к. либеральный - обнаруживает много различий, но иногда когда "вообще всё значимо" - тоже плохо: информация не обобщается. Тогда берём Тьюки.

Для такого мощного анализа ваши выборки можно считать очень большими, даже если исключить умерших. Можно пытаться обнаружить даже самые тонкие различия.

Сообщение отредактировал nokh - 26.12.2011 - 21:48
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Alex_Z
сообщение 26.12.2011 - 21:51
Сообщение #5





Группа: Пользователи
Сообщений: 59
Регистрация: 23.12.2011
Пользователь №: 23383



Так...Привожу мысли с порядок. Осмысляю постепенно и возникают еще вопросы.

1. "Индивид (Группа)" х "Время". (R ). Показывает индивидуальные различия в динамиках. Сам по себе не интересен и нужен для грамотного расчёта других эффектов.

Не совсем понял зачем смотреть взаимодействия "индивид" х "время" внутри группы.

2. "Группа" х Время" (F). Значимость данного эффекта укажет на существование межгрупповых различий в динамике.

А возможна ли такая ситуация, когда апостериорные критерии покажут достоверное различие между группами, тогда как при взаимодействии группа-время их не будет обнаружено. Или в этом случае применять апостериорные критерии неправильно?

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 27.12.2011 - 20:36
Сообщение #6





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



1. Можно и не смотреть, но учесть всё равно нужно:) Мы ведь в ДА разлагаем всю изменчивость (дисперсию) на части. Если что-то не учтём, значим и другое оценим неверно. В принципе, программа сама должна определить все возможные в данном дизайне взаимодействия факторов, при условии грамотного задания этих самых факторов и грамотности самой программы. Я перечислил все возможные в данном экспериментальном плане взаимодействия на тот случай если их придётся забивать вручную (в SPSS работал мало, а она с каждой версией становится всё запутаней, хотя уже и на русском).

2. По идее если взаимодействие незначимо - нет смысла проводить для него сравнения. Но в моей практике анализа сложных комплексов интересующие взаимодействия были значимы. Ещё раз говорю, что имея 50-60 человек в группе можно обнаружить самые мельчайшие различия в динамике, а они должны быть раз методы лечения отличаются. Другое дело окажутся ли эти статистически значимые различия ещё и клинически значимыми, но это уже другой и внестатистический вопрос...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему