Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Смешанная модель для количественных данных

Автор: comisora 19.03.2018 - 23:58

Коллеги доброй ночи.
Дано - длительность лечения как зависимая переменная - длительность.
Мы знаем, что у каждого в индивидуальное время возникло осложнение - сутки.осложнение.
Части пациентам назначили лечение, которое начато через некоторое индивидуальное время, а некоторым не назначали - сутки.лечение.старт.
Из тех, кто получал лечение, через некоторое индивидуальное время его отменяли - сутки.лечение.стоп.
Некоторым предлагалось дополнительное лечение, которое могло осуществляться трижды - сутки.доплечение.1, сутки.доплечение.2, сутки.доплечение.3
Дополнительное лечение случайно проводилось в доступной точке - точка.доплечения.
Задача - выяснить, как влияет момент суток осложнения, начала лечения, прекращения лечения, время дополнительного лечения, места доп.лечения на длительность госпитализации.
gather(example,этап,сутки,-c(ид,длительность,точка.доплечение))
glmer(длительность~сутки+(сутки|этап/точка.доплечение),ff,family='poisson') - это явно неправильная запись.
Подскажите правильный синтаксис, заранее спасибо.

example.txt ( 706 байт ) : 702

Автор: ogurtsov 20.03.2018 - 19:50

Там NA - это, похоже, не NA вовсе.
Начните с обычной линейной модели, лично мне не очевидно, каким образом сюда прикручиваются смешанные эффекты и пуассоновское распределение.

Автор: comisora 20.03.2018 - 20:50

2ogurtsov
Количество лежания на койках описывают пуассоновским распределением, так, по крайней мере, https://academic.oup.com/ndt/article/30/8/1244/2324966.
Действительно, NA в местах сутки.лечение.старт и сутки.лечение.стоп - это фактор есть лечение/нет лечения. Если их позаменять нулями, насколько представляю, введение искусственного фактора не потребуется.
Смешанная модель вот причем.
Длительность.лечения <- сутки.лечение.стоп-сутки.лечение.старт
Задержка.лечения <- сутки.лечение.старт-сутки.осложнение
Вроде подходит под обычную модель. Но, в моем представлении, сутки начала осложнения и задержку лечения можно рассматривать как случайные факторы. Дальше - кто в лес, кто по дрова: одним что-то вводят 1 раз, другим - 2 раза, третьим - 3 раза (в разных местах и в разное время), остальным - ничего не давали (возможно не так все плохо было). Раз кому-то что-то делалось больше одного раза, допускаю наличие внутрисубъектной изменчивости(1|ид). Сложная модель какая-то.

Код

data <- read.delim('clipboard')
data$длительность.лечения <- сутки.лечение.стоп-сутки.лечение.старт
data$задержка.лечения <- сутки.лечение.старт-сутки.осложнение
data$длительность.лечения <- ifelse(is.na(data$длительность.лечения)==TRUE,0,data$длительность.лечения)
data$задержка.лечения <- ifelse(is.na(data$задержка.лечения)==TRUE,0,data$задержка.лечения)
fit0<-glmer(длительность~длительность.лечения+(1|задержка.лечения)+(1|сутки.осложнение),data,family='poisson')

Пока все что в голову пришло.

Автор: ogurtsov 20.03.2018 - 22:36

Тогда еще вопрос - всего строк данных сколько? Что дают однофакторные модели (желательно в плане прогнозного качества по кросс-валидации)?