Динамика с выбывающими |
Здравствуйте, гость ( Вход | Регистрация )
Динамика с выбывающими |
10.02.2016 - 23:59
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 10.02.2016 Пользователь №: 27976 |
Подскажите, пожалуйста.
Необходимо провести анализ биохимических показателей в 9 временных точках (сравнение групп, динамика внутри групп). Но. Число больных в группах меняется со временем - выписываются, умирают. Даже представить себе не могу как поступить |
|
11.02.2016 - 09:02
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 |
Вариантов немного.
1. Анализируйте то, что есть. Можно оставить только те временные точки, для которых есть достаточное количество наблюдений (например, с первой по четвертую). Или же отобрать пациентов, для которых есть все измерения, и работать только с ними. Попытки восполнения пропущенных данных тут не имеют никакого смысла, особенно для умерших пациентов. 2. Более креативный вариант: придумайте некие представляющие интерес целевые уровни показателей и анализируйте наступление соответствующих исходов (достижение этих уровней) при помощи методов анализа выживаемости для цензурированных данных. Сообщение отредактировал ogurtsov - 11.02.2016 - 09:03 |
|
11.02.2016 - 11:40
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Подскажите, пожалуйста. Необходимо провести анализ биохимических показателей в 9 временных точках (сравнение групп, динамика внутри групп). Но. Число больных в группах меняется со временем - выписываются, умирают. Даже представить себе не могу как поступить А что нам эти "группы"? Это ведь фикция. Вводите в датасет просто фактор IDpacient, "воздействие", "точка обследования" и просто считайте модель с таким неполным дизайном. Сообщение отредактировал p2004r - 11.02.2016 - 11:58 |
|
11.02.2016 - 18:25
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Если датасет не секретный (или его можно обезличить) то загрузите его сюда, всё веселее будет
|
|
13.02.2016 - 09:54
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
1) Меня учили, что если удалить из данных 5% наблюдений и в результате дисперсионный комплекс станет ортогональным - это оправданная жертва, оправданная несмещённостью оценки эффектов. Поэтому если умершие/выбывшие - только единицы в хорошем массиве данных, то их можно удалять прямо построчно - "погоды" не сделают, только мешаются.
2) Для общих линейных моделей (General Linear Models, GLM), которыми сейчас обсчитываются комплексы с количественными показателями и для обобщённых линейных моделей (Generalized ...), которыми обсчитываются комплексы с любыми показателями, пропущенные ячейки не проблема. Это проблема реализации данных алгоритмов в конкретном статпакете. Т.е. можно подобрать софт, который всё грамотно посчитает несмотря на дыры в массиве. Собственно, оба варианта вам уже предложили выше. |
|
15.02.2016 - 15:48
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 10.02.2016 Пользователь №: 27976 |
Спасибо большое!
К сожалению я не могу выложить данные - руководитель категорически против. а не подскажите ли мне... От меня хотят сравнения срединных показателей между группами за весь период наблюдения. Т.е. 1-временная точка + 2-я +... и среднее (медиана) в группе. На первый взгляд мне это кажется полным бредом. Но, с другой стороны, в одних случаях показатели в течение болезни изменяются значительно меньше, чем в других. Наверно все-же нужно как-то не так? |
|
15.02.2016 - 16:07
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 |
У вам должны быть внятно сформулированы цель и задачи исследования - до, а не после или во время анализа данных. Методы анализа, сама потребность в тех или иных сравнениях обусловлены задаваемыми вопросами, а не наоборот.
|
|
15.02.2016 - 16:26
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 10.02.2016 Пользователь №: 27976 |
Да, конечно. Задача как раз и состоит в том, чтобы выявить различия в динамике биохимических показателей в процессе ифекционного заболевания.
Я могу 1) сравнить показатели в начале болезни и рассмотреть их в качестве предиктора того или иного варианта течения заболевания 2) выявить наличие некого определенного сдвига показателей в определенный период болезни. Но как определить степень изменения этих показателей? Четко по времени у разных больных они не совпадают. |
|
15.02.2016 - 17:33
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Спасибо большое! К сожалению я не могу выложить данные - руководитель категорически против. а не подскажите ли мне... От меня хотят сравнения срединных показателей между группами за весь период наблюдения. Т.е. 1-временная точка + 2-я +... и среднее (медиана) в группе. На первый взгляд мне это кажется полным бредом. Но, с другой стороны, в одних случаях показатели в течение болезни изменяются значительно меньше, чем в других. Наверно все-же нужно как-то не так? 1) Каждый из факторов (например личность обследуемого, пол, наличие того или иного воздействия) который будет введен в дизайн можно оценить с точки его влияния на поведение матожидания (фиксед эффект) и дисперсии (миксед эффект) для выбранной в качестве зависимого показателя (можно также ввести другие показатели как дополнительные факторы). То есть эффект будет из ходя из предположения что все остальные факторы в модели зафиксированы на одном уровне. Смотря на всякие AIC подбираем оптимальную модель. 2) Если просто посмотреть "что происходит", то рисуем индивидуальные траектории людей по показателю объявленному зависимым от времени. Различные значки в точках замеров, цвет и толщина линий отображают факторы дизайна этого наблюдения. Поверх этой картины линий (в точках замеров) накладываются "ящики в усами" которые например цветом отображают какие уровни факторов дизайна они отображают. 3) в принципе можно задать целевое "разбиение на группы"-фактор который действительно интересовал в данном эксперименте и запустив тот же бутстреп Boruta получить сразу влияющие на различие уровней фактора показателей. В принципе можно и регрессионную модель наилучшую строить, по действиям это не будет вообще отличаться от исходной постановки. Наверное такой подход позволит найти все значимое в данных и решить что имеет смысл показывать. В принципе все это можно одним достаточно длинным описание ggplot2 нарисовать. |
|