Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Динамика с выбывающими
Аля Ч
сообщение 10.02.2016 - 23:59
Сообщение #1





Группа: Пользователи
Сообщений: 3
Регистрация: 10.02.2016
Пользователь №: 27976



Подскажите, пожалуйста.
Необходимо провести анализ биохимических показателей в 9 временных точках (сравнение групп, динамика внутри групп). Но. Число больных в группах меняется со временем - выписываются, умирают. Даже представить себе не могу как поступить frown.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ogurtsov
сообщение 11.02.2016 - 09:02
Сообщение #2





Группа: Пользователи
Сообщений: 127
Регистрация: 15.12.2015
Пользователь №: 27760



Вариантов немного.
1. Анализируйте то, что есть. Можно оставить только те временные точки, для которых есть достаточное количество наблюдений (например, с первой по четвертую). Или же отобрать пациентов, для которых есть все измерения, и работать только с ними. Попытки восполнения пропущенных данных тут не имеют никакого смысла, особенно для умерших пациентов.
2. Более креативный вариант: придумайте некие представляющие интерес целевые уровни показателей и анализируйте наступление соответствующих исходов (достижение этих уровней) при помощи методов анализа выживаемости для цензурированных данных.

Сообщение отредактировал ogurtsov - 11.02.2016 - 09:03


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 11.02.2016 - 11:40
Сообщение #3





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Аля Ч @ 10.02.2016 - 23:59) *
Подскажите, пожалуйста.
Необходимо провести анализ биохимических показателей в 9 временных точках (сравнение групп, динамика внутри групп). Но. Число больных в группах меняется со временем - выписываются, умирают. Даже представить себе не могу как поступить frown.gif



А что нам эти "группы"? Это ведь фикция. Вводите в датасет просто фактор IDpacient, "воздействие", "точка обследования" и просто считайте модель с таким неполным дизайном.

Сообщение отредактировал p2004r - 11.02.2016 - 11:58


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 11.02.2016 - 18:25
Сообщение #4





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Если датасет не секретный (или его можно обезличить) то загрузите его сюда, всё веселее будет smile.gif


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 13.02.2016 - 09:54
Сообщение #5





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



1) Меня учили, что если удалить из данных 5% наблюдений и в результате дисперсионный комплекс станет ортогональным - это оправданная жертва, оправданная несмещённостью оценки эффектов. Поэтому если умершие/выбывшие - только единицы в хорошем массиве данных, то их можно удалять прямо построчно - "погоды" не сделают, только мешаются.

2) Для общих линейных моделей (General Linear Models, GLM), которыми сейчас обсчитываются комплексы с количественными показателями и для обобщённых линейных моделей (Generalized ...), которыми обсчитываются комплексы с любыми показателями, пропущенные ячейки не проблема. Это проблема реализации данных алгоритмов в конкретном статпакете. Т.е. можно подобрать софт, который всё грамотно посчитает несмотря на дыры в массиве.

Собственно, оба варианта вам уже предложили выше.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Аля Ч
сообщение 15.02.2016 - 15:48
Сообщение #6





Группа: Пользователи
Сообщений: 3
Регистрация: 10.02.2016
Пользователь №: 27976



Спасибо большое!
К сожалению я не могу выложить данные - руководитель категорически против.
а не подскажите ли мне...
От меня хотят сравнения срединных показателей между группами за весь период наблюдения.
Т.е. 1-временная точка + 2-я +... и среднее (медиана) в группе.
На первый взгляд мне это кажется полным бредом. Но, с другой стороны, в одних случаях показатели в течение болезни изменяются значительно меньше, чем в других. Наверно все-же нужно как-то не так?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ogurtsov
сообщение 15.02.2016 - 16:07
Сообщение #7





Группа: Пользователи
Сообщений: 127
Регистрация: 15.12.2015
Пользователь №: 27760



У вам должны быть внятно сформулированы цель и задачи исследования - до, а не после или во время анализа данных. Методы анализа, сама потребность в тех или иных сравнениях обусловлены задаваемыми вопросами, а не наоборот.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Аля Ч
сообщение 15.02.2016 - 16:26
Сообщение #8





Группа: Пользователи
Сообщений: 3
Регистрация: 10.02.2016
Пользователь №: 27976



Да, конечно. Задача как раз и состоит в том, чтобы выявить различия в динамике биохимических показателей в процессе ифекционного заболевания.
Я могу
1) сравнить показатели в начале болезни и рассмотреть их в качестве предиктора того или иного варианта течения заболевания
2) выявить наличие некого определенного сдвига показателей в определенный период болезни.
Но как определить степень изменения этих показателей? Четко по времени у разных больных они не совпадают.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 15.02.2016 - 17:33
Сообщение #9





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Аля Ч @ 15.02.2016 - 15:48) *
Спасибо большое!
К сожалению я не могу выложить данные - руководитель категорически против.
а не подскажите ли мне...
От меня хотят сравнения срединных показателей между группами за весь период наблюдения.
Т.е. 1-временная точка + 2-я +... и среднее (медиана) в группе.
На первый взгляд мне это кажется полным бредом. Но, с другой стороны, в одних случаях показатели в течение болезни изменяются значительно меньше, чем в других. Наверно все-же нужно как-то не так?


1) Каждый из факторов (например личность обследуемого, пол, наличие того или иного воздействия) который будет введен в дизайн можно оценить с точки его влияния на поведение матожидания (фиксед эффект) и дисперсии (миксед эффект) для выбранной в качестве зависимого показателя (можно также ввести другие показатели как дополнительные факторы). То есть эффект будет из ходя из предположения что все остальные факторы в модели зафиксированы на одном уровне.

Смотря на всякие AIC подбираем оптимальную модель.

2) Если просто посмотреть "что происходит", то рисуем индивидуальные траектории людей по показателю объявленному зависимым от времени. Различные значки в точках замеров, цвет и толщина линий отображают факторы дизайна этого наблюдения. Поверх этой картины линий (в точках замеров) накладываются "ящики в усами" которые например цветом отображают какие уровни факторов дизайна они отображают.


3) в принципе можно задать целевое "разбиение на группы"-фактор который действительно интересовал в данном эксперименте и запустив тот же бутстреп Boruta получить сразу влияющие на различие уровней фактора показателей. В принципе можно и регрессионную модель наилучшую строить, по действиям это не будет вообще отличаться от исходной постановки. Наверное такой подход позволит найти все значимое в данных и решить что имеет смысл показывать.
В принципе все это можно одним достаточно длинным описание ggplot2 нарисовать.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему