Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ ROC-анализ

Автор: Nerbi 8.11.2017 - 12:54

Здравствуйте! Подскажите, корректно ли строитьROC-кривую без проведения логистической регрессии и можно ли для построения ROC-кривой использовать значение признака (например, возраст или уровень гликемии, или скорость клубочковой фильтрации) с целью определения того значения признака, которое бы служило порогом, влияющим на исход заболевания?

Автор: p2004r 8.11.2017 - 13:00

Цитата(Nerbi @ 8.11.2017 - 12:54) *
Здравствуйте! Подскажите, корректно ли строитьROC-кривую без проведения логистической регрессии и можно ли для построения ROC-кривой использовать значение признака (например, возраст или уровень гликемии, или скорость клубочковой фильтрации) с целью определения того значения признака, которое бы служило порогом, влияющим на исход заболевания?


ROC всё равно откуда взялся предиктор. Она вся состоит из точек (порогов) принятия решения, поэтому оптимальную точку принятия решения надо выбирать указывая (как минимум) частоту исходов в популяции где планируется использовать данный предиктор. А как максимум надо использовать для выбора точки принятия решения ещё и соотношение материальных потерь при ошибках первого и второго родов.

Автор: leo_biostat 8.11.2017 - 13:55

Цитата(Nerbi @ 8.11.2017 - 12:54) *
Здравствуйте! Подскажите, корректно ли строитьROC-кривую без проведения логистической регрессии и можно ли для построения ROC-кривой использовать значение признака (например, возраст или уровень гликемии, или скорость клубочковой фильтрации) с целью определения того значения признака, которое бы служило порогом, влияющим на исход заболевания?


Nerbi, hi.gif!

Без использования логистической регрессии ROC-кривые можно построить отдельно для каждого признака (переменной). Тогда как используя логистическую регрессию, ROC-кривая строится более продуктивно, учитывая все признаки, вошедшие в уравнение. Напомню, что эти признаки, называемые предикторами, существенно повышают степень взаимосвязи зависимой переменной от набора предикторов. Нежели степень взаимосвязи зависимой переменной и ОДНОГО признака. Пример такой взаимосвязи можете прочитать в статьях про логистическую регрессию, в частности по адресу http://www.biometrica.tomsk.ru/logit_4.htm

Успеха, Nerbi!

Автор: p2004r 8.11.2017 - 14:44

Цитата(leo_biostat @ 8.11.2017 - 13:55) *
Nerbi, hi.gif!

Без использования логистической регрессии ROC-кривые можно построить отдельно для каждого признака (переменной). Тогда как используя логистическую регрессию, ROC-кривая строится более продуктивно, учитывая все признаки, вошедшие в уравнение. Напомню, что эти признаки, называемые предикторами, существенно повышают степень взаимосвязи зависимой переменной от набора предикторов. Нежели степень взаимосвязи зависимой переменной и ОДНОГО признака. Пример такой взаимосвязи можете прочитать в статьях про логистическую регрессию, в частности по адресу http://www.biometrica.tomsk.ru/logit_4.htm

Успеха, Nerbi!


1) Сваливать в одну модель склонную к переобучению все независимые переменные вместе крайне плохой совет, стратегия которая ведет к переподгонке и полной неинформативности модели.

2) Ну а включение в модель логично начинать с показателей которые что то гарантированно значат для зависимой переменной.

Так что не могу не порекомендовать снова library(Boruta) https://m2.icm.edu.pl/boruta/ и аналогичные пакеты реализующие идею feature selection.

Примеры использования в статьях https://scholar.google.com/scholar?cites=13748968550215677895

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)