Переменные логистического уравнения - Форум врачей-аспирантов

Форум врачей-аспирантов

Правила форума

Пользователи

Календарь

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Добавить ответ в эту тему

Открыть тему

Переменные логистического уравнения

_alena_ Просмотр профиля	13.05.2012 - 21:34 Сообщение #1
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301	здравствуйте. скажите как можно обойти следующую ситуацию: исследовали переменные и часть из них вошли в уравнение логистической модели. а что если в каком то из исследований мы не можем задать какую то переменную . как быть в такой ситуации?

p2004r Просмотр профиля	13.05.2012 - 21:42 Сообщение #2
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(_alena_ @ 13.05.2012 - 21:34) здравствуйте. скажите как можно обойти следующую ситуацию: исследовали переменные и часть из них вошли в уравнение логистической модели. а что если в каком то из исследований мы не можем задать какую то переменную . как быть в такой ситуации? Amelia, mitools, mix это пакеты для импутации пропущенных значений в R. вот такой пример гуглится Код titanic <- read.table("http://lib.stat.cmu.edu/S/Harrell/data/ascii/titanic.txt", sep=',', header=TRUE) set.seed(4321) titanic$sex[sample(nrow(titanic), 10)] <- NA titanic$pclass[sample(nrow(titanic), 10)] <- NA titanic$survived[sample(nrow(titanic), 10)] <- NA library(Amelia) # generate multiple imputations library(mitools) # for MIextract() library(mix) # for mi.inference() titanic.amelia <- amelia(subset(titanic, select=c('survived','pclass','sex','age')), m=10, noms=c('survived','pclass','sex'), emburn=c(500,500)) allimplogreg <- lapply(titanic.amelia$imputations, function(x){glm(survived ~ pclass + sex + age, family=binomial, data = x)}) mice.betas.glm <- MIextract(allimplogreg, fun=function(x){coef(x)}) mice.se.glm <- MIextract(allimplogreg, fun=function(x){sqrt(diag(vcov(x)))}) as.data.frame(mi.inference(mice.betas.glm, mice.se.glm)) # Or using only mitools for pooled inference betas <- MIextract(allimplogreg, fun=coef) vars <- MIextract(allimplogreg, fun=vcov) summary(MIcombine(betas,vars)) http://r-statistics.livejournal.com/

_alena_ Просмотр профиля	13.05.2012 - 21:54 Сообщение #3
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301	наверно не совсем корректно обьяснила - уже модель построена и в нее вошли скажем 5 переменных из 20. а теперь для проверки работы модели мы не знаем по каким то причинам какоето одно из этих 5 значений.

p2004r Просмотр профиля	13.05.2012 - 23:07 Сообщение #4
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(_alena_ @ 13.05.2012 - 21:54) наверно не совсем корректно обьяснила - уже модель построена и в нее вошли скажем 5 переменных из 20. а теперь для проверки работы модели мы не знаем по каким то причинам какоето одно из этих 5 значений. именно для пропущенных значений импутацию и делают. и если она срабатывает для обучения, то для предикта уж тем более подойдет. http://r-statistics.livejournal.com/

DrgLena Просмотр профиля	14.05.2012 - 10:23 Сообщение #5
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Я так поняла ситуацию, в одном исследовании получена приличная модель, которую хотят использовать для прогноза на другой группе больных, но в этой группе отсутствуют данные по одному их предикторов, например у них не была сделана биопсия, которая была в двух категориях (высокозлокачественные клетки или не очень). При такой ситуации ничего нельзя импутировать.

p2004r Просмотр профиля	14.05.2012 - 11:44 Сообщение #6
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(DrgLena @ 14.05.2012 - 10:23) Я так поняла ситуацию, в одном исследовании получена приличная модель, которую хотят использовать для прогноза на другой группе больных, но в этой группе отсутствуют данные по одному их предикторов, например у них не была сделана биопсия, которая была в двух категориях (высокозлокачественные клетки или не очень). При такой ситуации ничего нельзя импутировать. имея в одном исследовании закон распределения для предикторов и отсутствующие данные по предикторам во втором исследовании можно и нужно получить _оценки_ приличной модели. сделать это крайне просто, по случаю с пропущенным значением предиктора считается сразу много случаев в которых подставлены все известные предикторы, а для неизвестного(ных) делается перевыборка из данных исследования в котором была получена модель. на выходе вместо вероятности исхода будем иметь распределение вероятности исхода. Сообщение отредактировал p2004r - 14.05.2012 - 12:26 http://r-statistics.livejournal.com/

« Предыдущая тема · Медицинская статистика · Следующая тема »

Добавить ответ в эту тему

Открыть тему

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Форум IP.Board © 2024 IPS, Inc.