Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Динамика с выбывающими
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Аля Ч
Подскажите, пожалуйста.
Необходимо провести анализ биохимических показателей в 9 временных точках (сравнение групп, динамика внутри групп). Но. Число больных в группах меняется со временем - выписываются, умирают. Даже представить себе не могу как поступить frown.gif
ogurtsov
Вариантов немного.
1. Анализируйте то, что есть. Можно оставить только те временные точки, для которых есть достаточное количество наблюдений (например, с первой по четвертую). Или же отобрать пациентов, для которых есть все измерения, и работать только с ними. Попытки восполнения пропущенных данных тут не имеют никакого смысла, особенно для умерших пациентов.
2. Более креативный вариант: придумайте некие представляющие интерес целевые уровни показателей и анализируйте наступление соответствующих исходов (достижение этих уровней) при помощи методов анализа выживаемости для цензурированных данных.
p2004r
Цитата(Аля Ч @ 10.02.2016 - 23:59) *
Подскажите, пожалуйста.
Необходимо провести анализ биохимических показателей в 9 временных точках (сравнение групп, динамика внутри групп). Но. Число больных в группах меняется со временем - выписываются, умирают. Даже представить себе не могу как поступить frown.gif



А что нам эти "группы"? Это ведь фикция. Вводите в датасет просто фактор IDpacient, "воздействие", "точка обследования" и просто считайте модель с таким неполным дизайном.
p2004r
Если датасет не секретный (или его можно обезличить) то загрузите его сюда, всё веселее будет smile.gif
nokh
1) Меня учили, что если удалить из данных 5% наблюдений и в результате дисперсионный комплекс станет ортогональным - это оправданная жертва, оправданная несмещённостью оценки эффектов. Поэтому если умершие/выбывшие - только единицы в хорошем массиве данных, то их можно удалять прямо построчно - "погоды" не сделают, только мешаются.

2) Для общих линейных моделей (General Linear Models, GLM), которыми сейчас обсчитываются комплексы с количественными показателями и для обобщённых линейных моделей (Generalized ...), которыми обсчитываются комплексы с любыми показателями, пропущенные ячейки не проблема. Это проблема реализации данных алгоритмов в конкретном статпакете. Т.е. можно подобрать софт, который всё грамотно посчитает несмотря на дыры в массиве.

Собственно, оба варианта вам уже предложили выше.
Аля Ч
Спасибо большое!
К сожалению я не могу выложить данные - руководитель категорически против.
а не подскажите ли мне...
От меня хотят сравнения срединных показателей между группами за весь период наблюдения.
Т.е. 1-временная точка + 2-я +... и среднее (медиана) в группе.
На первый взгляд мне это кажется полным бредом. Но, с другой стороны, в одних случаях показатели в течение болезни изменяются значительно меньше, чем в других. Наверно все-же нужно как-то не так?
ogurtsov
У вам должны быть внятно сформулированы цель и задачи исследования - до, а не после или во время анализа данных. Методы анализа, сама потребность в тех или иных сравнениях обусловлены задаваемыми вопросами, а не наоборот.
Аля Ч
Да, конечно. Задача как раз и состоит в том, чтобы выявить различия в динамике биохимических показателей в процессе ифекционного заболевания.
Я могу
1) сравнить показатели в начале болезни и рассмотреть их в качестве предиктора того или иного варианта течения заболевания
2) выявить наличие некого определенного сдвига показателей в определенный период болезни.
Но как определить степень изменения этих показателей? Четко по времени у разных больных они не совпадают.
p2004r
Цитата(Аля Ч @ 15.02.2016 - 15:48) *
Спасибо большое!
К сожалению я не могу выложить данные - руководитель категорически против.
а не подскажите ли мне...
От меня хотят сравнения срединных показателей между группами за весь период наблюдения.
Т.е. 1-временная точка + 2-я +... и среднее (медиана) в группе.
На первый взгляд мне это кажется полным бредом. Но, с другой стороны, в одних случаях показатели в течение болезни изменяются значительно меньше, чем в других. Наверно все-же нужно как-то не так?


1) Каждый из факторов (например личность обследуемого, пол, наличие того или иного воздействия) который будет введен в дизайн можно оценить с точки его влияния на поведение матожидания (фиксед эффект) и дисперсии (миксед эффект) для выбранной в качестве зависимого показателя (можно также ввести другие показатели как дополнительные факторы). То есть эффект будет из ходя из предположения что все остальные факторы в модели зафиксированы на одном уровне.

Смотря на всякие AIC подбираем оптимальную модель.

2) Если просто посмотреть "что происходит", то рисуем индивидуальные траектории людей по показателю объявленному зависимым от времени. Различные значки в точках замеров, цвет и толщина линий отображают факторы дизайна этого наблюдения. Поверх этой картины линий (в точках замеров) накладываются "ящики в усами" которые например цветом отображают какие уровни факторов дизайна они отображают.


3) в принципе можно задать целевое "разбиение на группы"-фактор который действительно интересовал в данном эксперименте и запустив тот же бутстреп Boruta получить сразу влияющие на различие уровней фактора показателей. В принципе можно и регрессионную модель наилучшую строить, по действиям это не будет вообще отличаться от исходной постановки. Наверное такой подход позволит найти все значимое в данных и решить что имеет смысл показывать.
В принципе все это можно одним достаточно длинным описание ggplot2 нарисовать.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.