Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Предсказание ухода пациента из исследования

Автор: medmonitor 25.01.2018 - 16:54

Здравствуйте. Никак не могу разобраться со своим исследованием. Стояла задача предсказать вероятность ухода пациента из исследования. Использовал логистическую регрессию. (собственно эту идею тут на форуме и прочел, очень частый вопрос)
Получил такую таблицу классификаций.
Pred. 1 Pred. 0 Percent
1,000000| 13 | 169 | 7,14286
0,000000| 16 | 485 | 96,80639

1-ушел из исследования добровольно , 0 остался
как видите тех кто остался программа классифицировало относительно верно,а вот 169 выбывших неверно записала в нули

у меня отношение шансов составило 2,3317
Как мне в таком случае проинтерпретировать значения OR?

Автор: leo_biostat 25.01.2018 - 17:43

Цитата(medmonitor @ 25.01.2018 - 16:54) *
Здравствуйте. Никак не могу разобраться со своим исследованием. Стояла задача предсказать вероятность ухода пациента из исследования. Использовал логистическую регрессию. (собственно эту идею тут на форуме и прочел, очень частый вопрос)
Получил такую таблицу классификаций.
Pred. 1 Pred. 0 Percent
1,000000| 13 | 169 | 7,14286
0,000000| 16 | 485 | 96,80639

1-ушел из исследования добровольно , 0 остался
как видите тех кто остался программа классифицировало относительно верно,а вот 169 выбывших неверно записала в нули

у меня отношение шансов составило 2,3317
Как мне в таком случае проинтерпретировать значения OR?


Коллега, hi.gif!

Описанная Вами проблема весьма частая и актуальная.
Однако эта проблема чаще всего возникает из-за низкого уровня использования довольно сложного метода логистической регрессии.
И сложность этого метода не понимают те, кто не являются профессиональными биостатистиками (см. http://biometrica.tomsk.ru/logit_0.htm).
Поскольку в этом методе немало как ограничений, так и немало разных алгоритмов. К тому же основным результатом этого метода не является OR.
Учитывая объём наблюдений в Вашей БД, уверен, что можно получить и гораздо более продуктивные решения.
Однако, не имея в доступе детали Вашего исследования, не могу ничего предложить.
Если Вы желаете получить от меня помощь, то сообщите мне свой ник в Скайпе, и я выйду на связь с Вами. И тогда обсудим Вашу проблему.

Успеха!

Автор: medmonitor 25.01.2018 - 18:15

leo_biostat, а можете пока просто сказать, что означает цифра OR в моем исследовании, что зная эту цифру я могу сказать?

Автор: leo_biostat 25.01.2018 - 19:58

Цитата(medmonitor @ 25.01.2018 - 18:15) *
leo_biostat, а можете пока просто сказать, что означает цифра OR в моем исследовании, что зная эту цифру я могу сказать?


Коллега, hi.gif!

Прочитайте описание ОШ (OR) в статьях по следующим адресам:

https://ru.wikipedia.org/wiki/%D0%9E%D1%82%D0%BD%D0%BE%D1%88%D0%B5%D0%BD%D0%B8%D0%B5_%D1%88%D0%B0%D0%BD%D1%81%D0%BE%D0%B2

http://helpiks.org/8-46481.html

http://wp.wiki-wiki.ru/wp/index.php/%D0%9E%D1%82%D0%BD%D0%BE%D1%88%D0%B5%D0%BD%D0%B8%D0%B5_%D1%88%D0%B0%D0%BD%D1%81%D0%BE%D0%B2

http://rpp.nashaucheba.ru/docs/index-43325.html?page=11

http://www.realcoding.net/teach/SPSS/Glava%2011/Index9.html

https://www.mediasphera.ru/issues/dokazatelnaya-kardiologiya/2015/1/252305-220120150110


Успеха!

Автор: DrgLena 26.01.2018 - 04:50

Некоторые программы, например, программа Statistica после проведения логистической регрессии выдает результат в виде таблицы 2х2 предсказанные и реальные числа. Посчитанное по этой таблице OR означает отношение шансов остаться в исследовании и шаснов покинуть его, шансы остаться 485/16, а шансы покинуть 169/13, посчитайте теперь отношение этих шансов и получите 2,33 (ДИ 1,10; 4,95). Но это не имеет значения при низком прогнозе в группе выбывающих. И это OR не являтся оценкой фактора (ров) риска, а все ссылки, которые вам предложили изучить про факторы риска типа привиты не привиты, заболели, не заболели.

Автор: medmonitor 26.01.2018 - 16:41

DrgLena, Вы правы
485/16=30,3125
169/13=13
30,3125/13=2,33

Данные думаю надо как-то трансформировать.
т.е. данная цифра означает что шансов остаться в исследовании в 2 ,33 раза больше чем из него выбыть?

Автор: DrgLena 26.01.2018 - 21:23

Нет, вы не получили модель, которая способна для каждого участника прогнозировать вероятность ухода. Вы не получили оценку факторов риска ухода, те самые OR. Такая модель не нужна. Возьмите отношение ушедших к оставшимся и это будет полезней, чем демонстрировать модель, бесполезную для решения вашей задачи.


Автор: leo_biostat 27.01.2018 - 07:22

Цитата(DrgLena @ 26.01.2018 - 21:23) *
Нет, вы не получили модель, которая способна для каждого участника прогнозировать вероятность ухода. Вы не получили оценку факторов риска ухода, те самые OR. Такая модель не нужна. Возьмите отношение ушедших к оставшимся и это будет полезней, чем демонстрировать модель, бесполезную для решения вашей задачи.


Полностью поддерживаю мнение DrgLena. Многолетний опыт анализа диссертаций и журнальных статей показывает,
что уровень получаемых авторами моделей, определяется уровнем необходимости получать полезные для своей работы результаты исследований.

Автор: p2004r 27.01.2018 - 11:38

Цитата(medmonitor @ 25.01.2018 - 16:54) *
Здравствуйте. Никак не могу разобраться со своим исследованием. Стояла задача предсказать вероятность ухода пациента из исследования. Использовал логистическую регрессию. (собственно эту идею тут на форуме и прочел, очень частый вопрос)
Получил такую таблицу классификаций.
Pred. 1 Pred. 0 Percent
1,000000| 13 | 169 | 7,14286
0,000000| 16 | 485 | 96,80639

1-ушел из исследования добровольно , 0 остался
как видите тех кто остался программа классифицировало относительно верно,а вот 169 выбывших неверно записала в нули

у меня отношение шансов составило 2,3317
Как мне в таком случае проинтерпретировать значения OR?


У Вас перекос в численности между группами и это регрессия автоматом учитывает. Надо смотреть на ROC для оценки качества модели независимого от размера групп (может оказаться что модель вообще ничтожна). Для коррекции коэфициентов модели посмотрите, может есть параметр веса который можно задать для исхода, тогда сделайте его обратно пропорциональным размеру групп. У Вас все таки задача сделать оценку риска, а не лучший прогноз для данных частот встречаемости.

Автор: ogurtsov 27.01.2018 - 19:47

Вообще с практической точки зрения имеет смысл строить модель, предсказывающую вероятность выбывания новых пациентов (например, чтобы подкорректировать критерии включения/невключения и включать поменьше тех, кто с высокой вероятностью откажется от исследования). То есть модель нужно подбирать с использованием перекрестной проверки и делать итоговую оценку на тестовой выборке, плюс затем проверять в боевых условиях.

Автор: DrgLena 28.01.2018 - 04:30

Интересно, какие переменные использовались в качестве предикторов. Тут возможны ошибки при использовании программы Statistica.

Автор: medmonitor 28.01.2018 - 16:10

Добрый день, спасибо за все Ваши советы. Информации много, Буду анализировать.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)