Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Предсказание ухода пациента из исследования
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
medmonitor
Здравствуйте. Никак не могу разобраться со своим исследованием. Стояла задача предсказать вероятность ухода пациента из исследования. Использовал логистическую регрессию. (собственно эту идею тут на форуме и прочел, очень частый вопрос)
Получил такую таблицу классификаций.
Pred. 1 Pred. 0 Percent
1,000000| 13 | 169 | 7,14286
0,000000| 16 | 485 | 96,80639

1-ушел из исследования добровольно , 0 остался
как видите тех кто остался программа классифицировало относительно верно,а вот 169 выбывших неверно записала в нули

у меня отношение шансов составило 2,3317
Как мне в таком случае проинтерпретировать значения OR?
leo_biostat
Цитата(medmonitor @ 25.01.2018 - 16:54) *
Здравствуйте. Никак не могу разобраться со своим исследованием. Стояла задача предсказать вероятность ухода пациента из исследования. Использовал логистическую регрессию. (собственно эту идею тут на форуме и прочел, очень частый вопрос)
Получил такую таблицу классификаций.
Pred. 1 Pred. 0 Percent
1,000000| 13 | 169 | 7,14286
0,000000| 16 | 485 | 96,80639

1-ушел из исследования добровольно , 0 остался
как видите тех кто остался программа классифицировало относительно верно,а вот 169 выбывших неверно записала в нули

у меня отношение шансов составило 2,3317
Как мне в таком случае проинтерпретировать значения OR?


Коллега, hi.gif!

Описанная Вами проблема весьма частая и актуальная.
Однако эта проблема чаще всего возникает из-за низкого уровня использования довольно сложного метода логистической регрессии.
И сложность этого метода не понимают те, кто не являются профессиональными биостатистиками (см. http://biometrica.tomsk.ru/logit_0.htm).
Поскольку в этом методе немало как ограничений, так и немало разных алгоритмов. К тому же основным результатом этого метода не является OR.
Учитывая объём наблюдений в Вашей БД, уверен, что можно получить и гораздо более продуктивные решения.
Однако, не имея в доступе детали Вашего исследования, не могу ничего предложить.
Если Вы желаете получить от меня помощь, то сообщите мне свой ник в Скайпе, и я выйду на связь с Вами. И тогда обсудим Вашу проблему.

Успеха!
medmonitor
leo_biostat, а можете пока просто сказать, что означает цифра OR в моем исследовании, что зная эту цифру я могу сказать?
leo_biostat
Цитата(medmonitor @ 25.01.2018 - 18:15) *
leo_biostat, а можете пока просто сказать, что означает цифра OR в моем исследовании, что зная эту цифру я могу сказать?


Коллега, hi.gif!

Прочитайте описание ОШ (OR) в статьях по следующим адресам:

https://ru.wikipedia.org/wiki/%D0%9E%D1%82%...%81%D0%BE%D0%B2

http://helpiks.org/8-46481.html

http://wp.wiki-wiki.ru/wp/index.php/%D0%9E...%81%D0%BE%D0%B2

http://rpp.nashaucheba.ru/docs/index-43325.html?page=11

http://www.realcoding.net/teach/SPSS/Glava%2011/Index9.html

https://www.mediasphera.ru/issues/dokazatel...05-220120150110


Успеха!
DrgLena
Некоторые программы, например, программа Statistica после проведения логистической регрессии выдает результат в виде таблицы 2х2 предсказанные и реальные числа. Посчитанное по этой таблице OR означает отношение шансов остаться в исследовании и шаснов покинуть его, шансы остаться 485/16, а шансы покинуть 169/13, посчитайте теперь отношение этих шансов и получите 2,33 (ДИ 1,10; 4,95). Но это не имеет значения при низком прогнозе в группе выбывающих. И это OR не являтся оценкой фактора (ров) риска, а все ссылки, которые вам предложили изучить про факторы риска типа привиты не привиты, заболели, не заболели.
medmonitor
DrgLena, Вы правы
485/16=30,3125
169/13=13
30,3125/13=2,33

Данные думаю надо как-то трансформировать.
т.е. данная цифра означает что шансов остаться в исследовании в 2 ,33 раза больше чем из него выбыть?
DrgLena
Нет, вы не получили модель, которая способна для каждого участника прогнозировать вероятность ухода. Вы не получили оценку факторов риска ухода, те самые OR. Такая модель не нужна. Возьмите отношение ушедших к оставшимся и это будет полезней, чем демонстрировать модель, бесполезную для решения вашей задачи.

leo_biostat
Цитата(DrgLena @ 26.01.2018 - 21:23) *
Нет, вы не получили модель, которая способна для каждого участника прогнозировать вероятность ухода. Вы не получили оценку факторов риска ухода, те самые OR. Такая модель не нужна. Возьмите отношение ушедших к оставшимся и это будет полезней, чем демонстрировать модель, бесполезную для решения вашей задачи.


Полностью поддерживаю мнение DrgLena. Многолетний опыт анализа диссертаций и журнальных статей показывает,
что уровень получаемых авторами моделей, определяется уровнем необходимости получать полезные для своей работы результаты исследований.
p2004r
Цитата(medmonitor @ 25.01.2018 - 16:54) *
Здравствуйте. Никак не могу разобраться со своим исследованием. Стояла задача предсказать вероятность ухода пациента из исследования. Использовал логистическую регрессию. (собственно эту идею тут на форуме и прочел, очень частый вопрос)
Получил такую таблицу классификаций.
Pred. 1 Pred. 0 Percent
1,000000| 13 | 169 | 7,14286
0,000000| 16 | 485 | 96,80639

1-ушел из исследования добровольно , 0 остался
как видите тех кто остался программа классифицировало относительно верно,а вот 169 выбывших неверно записала в нули

у меня отношение шансов составило 2,3317
Как мне в таком случае проинтерпретировать значения OR?


У Вас перекос в численности между группами и это регрессия автоматом учитывает. Надо смотреть на ROC для оценки качества модели независимого от размера групп (может оказаться что модель вообще ничтожна). Для коррекции коэфициентов модели посмотрите, может есть параметр веса который можно задать для исхода, тогда сделайте его обратно пропорциональным размеру групп. У Вас все таки задача сделать оценку риска, а не лучший прогноз для данных частот встречаемости.
ogurtsov
Вообще с практической точки зрения имеет смысл строить модель, предсказывающую вероятность выбывания новых пациентов (например, чтобы подкорректировать критерии включения/невключения и включать поменьше тех, кто с высокой вероятностью откажется от исследования). То есть модель нужно подбирать с использованием перекрестной проверки и делать итоговую оценку на тестовой выборке, плюс затем проверять в боевых условиях.
DrgLena
Интересно, какие переменные использовались в качестве предикторов. Тут возможны ошибки при использовании программы Statistica.
medmonitor
Добрый день, спасибо за все Ваши советы. Информации много, Буду анализировать.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.