Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Предсказание ухода пациента из исследования
medmonitor
сообщение 25.01.2018 - 16:54
Сообщение #1


Дух форума
*

Группа: Пользователи
Сообщений: 4
Регистрация: 25.01.2018
Пользователь №: 30885



Здравствуйте. Никак не могу разобраться со своим исследованием. Стояла задача предсказать вероятность ухода пациента из исследования. Использовал логистическую регрессию. (собственно эту идею тут на форуме и прочел, очень частый вопрос)
Получил такую таблицу классификаций.
Pred. 1 Pred. 0 Percent
1,000000| 13 | 169 | 7,14286
0,000000| 16 | 485 | 96,80639

1-ушел из исследования добровольно , 0 остался
как видите тех кто остался программа классифицировало относительно верно,а вот 169 выбывших неверно записала в нули

у меня отношение шансов составило 2,3317
Как мне в таком случае проинтерпретировать значения OR?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 25.01.2018 - 17:43
Сообщение #2


Дух форума
*

Группа: Пользователи
Сообщений: 85
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(medmonitor @ 25.01.2018 - 16:54) *
Здравствуйте. Никак не могу разобраться со своим исследованием. Стояла задача предсказать вероятность ухода пациента из исследования. Использовал логистическую регрессию. (собственно эту идею тут на форуме и прочел, очень частый вопрос)
Получил такую таблицу классификаций.
Pred. 1 Pred. 0 Percent
1,000000| 13 | 169 | 7,14286
0,000000| 16 | 485 | 96,80639

1-ушел из исследования добровольно , 0 остался
как видите тех кто остался программа классифицировало относительно верно,а вот 169 выбывших неверно записала в нули

у меня отношение шансов составило 2,3317
Как мне в таком случае проинтерпретировать значения OR?


Коллега, hi.gif!

Описанная Вами проблема весьма частая и актуальная.
Однако эта проблема чаще всего возникает из-за низкого уровня использования довольно сложного метода логистической регрессии.
И сложность этого метода не понимают те, кто не являются профессиональными биостатистиками (см. http://biometrica.tomsk.ru/logit_0.htm).
Поскольку в этом методе немало как ограничений, так и немало разных алгоритмов. К тому же основным результатом этого метода не является OR.
Учитывая объём наблюдений в Вашей БД, уверен, что можно получить и гораздо более продуктивные решения.
Однако, не имея в доступе детали Вашего исследования, не могу ничего предложить.
Если Вы желаете получить от меня помощь, то сообщите мне свой ник в Скайпе, и я выйду на связь с Вами. И тогда обсудим Вашу проблему.

Успеха!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
medmonitor
сообщение 25.01.2018 - 18:15
Сообщение #3


Дух форума
*

Группа: Пользователи
Сообщений: 4
Регистрация: 25.01.2018
Пользователь №: 30885



leo_biostat, а можете пока просто сказать, что означает цифра OR в моем исследовании, что зная эту цифру я могу сказать?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 25.01.2018 - 19:58
Сообщение #4


Дух форума
*

Группа: Пользователи
Сообщений: 85
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(medmonitor @ 25.01.2018 - 18:15) *
leo_biostat, а можете пока просто сказать, что означает цифра OR в моем исследовании, что зная эту цифру я могу сказать?


Коллега, hi.gif!

Прочитайте описание ОШ (OR) в статьях по следующим адресам:

https://ru.wikipedia.org/wiki/%D0%9E%D1%82%...%81%D0%BE%D0%B2

http://helpiks.org/8-46481.html

http://wp.wiki-wiki.ru/wp/index.php/%D0%9E...%81%D0%BE%D0%B2

http://rpp.nashaucheba.ru/docs/index-43325.html?page=11

http://www.realcoding.net/teach/SPSS/Glava%2011/Index9.html

https://www.mediasphera.ru/issues/dokazatel...05-220120150110


Успеха!

Сообщение отредактировал leo_biostat - 25.01.2018 - 22:06
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 26.01.2018 - 04:50
Сообщение #5


Дух форума
*

Группа: Пользователи
Сообщений: 1299
Регистрация: 27.11.2007
Пользователь №: 4573



Некоторые программы, например, программа Statistica после проведения логистической регрессии выдает результат в виде таблицы 2х2 предсказанные и реальные числа. Посчитанное по этой таблице OR означает отношение шансов остаться в исследовании и шаснов покинуть его, шансы остаться 485/16, а шансы покинуть 169/13, посчитайте теперь отношение этих шансов и получите 2,33 (ДИ 1,10; 4,95). Но это не имеет значения при низком прогнозе в группе выбывающих. И это OR не являтся оценкой фактора (ров) риска, а все ссылки, которые вам предложили изучить про факторы риска типа привиты не привиты, заболели, не заболели.

Сообщение отредактировал DrgLena - 26.01.2018 - 05:03
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
medmonitor
сообщение 26.01.2018 - 16:41
Сообщение #6


Дух форума
*

Группа: Пользователи
Сообщений: 4
Регистрация: 25.01.2018
Пользователь №: 30885



DrgLena, Вы правы
485/16=30,3125
169/13=13
30,3125/13=2,33

Данные думаю надо как-то трансформировать.
т.е. данная цифра означает что шансов остаться в исследовании в 2 ,33 раза больше чем из него выбыть?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 26.01.2018 - 21:23
Сообщение #7


Дух форума
*

Группа: Пользователи
Сообщений: 1299
Регистрация: 27.11.2007
Пользователь №: 4573



Нет, вы не получили модель, которая способна для каждого участника прогнозировать вероятность ухода. Вы не получили оценку факторов риска ухода, те самые OR. Такая модель не нужна. Возьмите отношение ушедших к оставшимся и это будет полезней, чем демонстрировать модель, бесполезную для решения вашей задачи.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 27.01.2018 - 07:22
Сообщение #8


Дух форума
*

Группа: Пользователи
Сообщений: 85
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(DrgLena @ 26.01.2018 - 21:23) *
Нет, вы не получили модель, которая способна для каждого участника прогнозировать вероятность ухода. Вы не получили оценку факторов риска ухода, те самые OR. Такая модель не нужна. Возьмите отношение ушедших к оставшимся и это будет полезней, чем демонстрировать модель, бесполезную для решения вашей задачи.


Полностью поддерживаю мнение DrgLena. Многолетний опыт анализа диссертаций и журнальных статей показывает,
что уровень получаемых авторами моделей, определяется уровнем необходимости получать полезные для своей работы результаты исследований.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 27.01.2018 - 11:38
Сообщение #9


Дух форума
*

Группа: Пользователи
Сообщений: 1019
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(medmonitor @ 25.01.2018 - 16:54) *
Здравствуйте. Никак не могу разобраться со своим исследованием. Стояла задача предсказать вероятность ухода пациента из исследования. Использовал логистическую регрессию. (собственно эту идею тут на форуме и прочел, очень частый вопрос)
Получил такую таблицу классификаций.
Pred. 1 Pred. 0 Percent
1,000000| 13 | 169 | 7,14286
0,000000| 16 | 485 | 96,80639

1-ушел из исследования добровольно , 0 остался
как видите тех кто остался программа классифицировало относительно верно,а вот 169 выбывших неверно записала в нули

у меня отношение шансов составило 2,3317
Как мне в таком случае проинтерпретировать значения OR?


У Вас перекос в численности между группами и это регрессия автоматом учитывает. Надо смотреть на ROC для оценки качества модели независимого от размера групп (может оказаться что модель вообще ничтожна). Для коррекции коэфициентов модели посмотрите, может есть параметр веса который можно задать для исхода, тогда сделайте его обратно пропорциональным размеру групп. У Вас все таки задача сделать оценку риска, а не лучший прогноз для данных частот встречаемости.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ogurtsov
сообщение 27.01.2018 - 19:47
Сообщение #10


Дух форума
*

Группа: Пользователи
Сообщений: 87
Регистрация: 15.12.2015
Пользователь №: 27760



Вообще с практической точки зрения имеет смысл строить модель, предсказывающую вероятность выбывания новых пациентов (например, чтобы подкорректировать критерии включения/невключения и включать поменьше тех, кто с высокой вероятностью откажется от исследования). То есть модель нужно подбирать с использованием перекрестной проверки и делать итоговую оценку на тестовой выборке, плюс затем проверять в боевых условиях.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 28.01.2018 - 04:30
Сообщение #11


Дух форума
*

Группа: Пользователи
Сообщений: 1299
Регистрация: 27.11.2007
Пользователь №: 4573



Интересно, какие переменные использовались в качестве предикторов. Тут возможны ошибки при использовании программы Statistica.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
medmonitor
сообщение 28.01.2018 - 16:10
Сообщение #12


Дух форума
*

Группа: Пользователи
Сообщений: 4
Регистрация: 25.01.2018
Пользователь №: 30885



Добрый день, спасибо за все Ваши советы. Информации много, Буду анализировать.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему