Смешанная модель для количественных данных, glmer |
Здравствуйте, гость ( Вход | Регистрация )
Смешанная модель для количественных данных, glmer |
19.03.2018 - 23:58
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 95 Регистрация: 27.12.2015 Пользователь №: 27815 |
Коллеги доброй ночи.
Дано - длительность лечения как зависимая переменная - длительность. Мы знаем, что у каждого в индивидуальное время возникло осложнение - сутки.осложнение. Части пациентам назначили лечение, которое начато через некоторое индивидуальное время, а некоторым не назначали - сутки.лечение.старт. Из тех, кто получал лечение, через некоторое индивидуальное время его отменяли - сутки.лечение.стоп. Некоторым предлагалось дополнительное лечение, которое могло осуществляться трижды - сутки.доплечение.1, сутки.доплечение.2, сутки.доплечение.3 Дополнительное лечение случайно проводилось в доступной точке - точка.доплечения. Задача - выяснить, как влияет момент суток осложнения, начала лечения, прекращения лечения, время дополнительного лечения, места доп.лечения на длительность госпитализации. gather(example,этап,сутки,-c(ид,длительность,точка.доплечение)) glmer(длительность~сутки+(сутки|этап/точка.доплечение),ff,family='poisson') - это явно неправильная запись. Подскажите правильный синтаксис, заранее спасибо.
Прикрепленные файлы
|
|
20.03.2018 - 19:50
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 |
Там NA - это, похоже, не NA вовсе.
Начните с обычной линейной модели, лично мне не очевидно, каким образом сюда прикручиваются смешанные эффекты и пуассоновское распределение. |
|
20.03.2018 - 20:50
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 95 Регистрация: 27.12.2015 Пользователь №: 27815 |
2ogurtsov
Количество лежания на койках описывают пуассоновским распределением, так, по крайней мере, пишут -ссылка. Действительно, NA в местах сутки.лечение.старт и сутки.лечение.стоп - это фактор есть лечение/нет лечения. Если их позаменять нулями, насколько представляю, введение искусственного фактора не потребуется. Смешанная модель вот причем. Длительность.лечения <- сутки.лечение.стоп-сутки.лечение.старт Задержка.лечения <- сутки.лечение.старт-сутки.осложнение Вроде подходит под обычную модель. Но, в моем представлении, сутки начала осложнения и задержку лечения можно рассматривать как случайные факторы. Дальше - кто в лес, кто по дрова: одним что-то вводят 1 раз, другим - 2 раза, третьим - 3 раза (в разных местах и в разное время), остальным - ничего не давали (возможно не так все плохо было). Раз кому-то что-то делалось больше одного раза, допускаю наличие внутрисубъектной изменчивости(1|ид). Сложная модель какая-то. Код data <- read.delim('clipboard') data$длительность.лечения <- сутки.лечение.стоп-сутки.лечение.старт data$задержка.лечения <- сутки.лечение.старт-сутки.осложнение data$длительность.лечения <- ifelse(is.na(data$длительность.лечения)==TRUE,0,data$длительность.лечения) data$задержка.лечения <- ifelse(is.na(data$задержка.лечения)==TRUE,0,data$задержка.лечения) fit0<-glmer(длительность~длительность.лечения+(1|задержка.лечения)+(1|сутки.осложнение),data,family='poisson') Пока все что в голову пришло. |
|
20.03.2018 - 22:36
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 |
Тогда еще вопрос - всего строк данных сколько? Что дают однофакторные модели (желательно в плане прогнозного качества по кросс-валидации)?
Сообщение отредактировал ogurtsov - 20.03.2018 - 22:36 |
|