ROC-кривая по результатам логистической регрессии |
Здравствуйте, гость ( Вход | Регистрация )
ROC-кривая по результатам логистической регрессии |
28.05.2010 - 23:23
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Для того чтобы выдавался свободный член, нужно набить ещё один столбец, заполненный одинаковым числом, и включить его в область анализа. Интуитивно это совсем непонятно, но описано в помощи к AtteStat. Когда тестировал этот модуль таким способом было полное совпадение с MedCalc, а десятичных знаков даже больше. Да, я об этом забыла, хотя автор на форуме об этом писал. |
|
29.05.2010 - 01:14
Сообщение
#17
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 6.02.2010 Из: Клайпеда Пользователь №: 10967 |
Качество данных, можно не обсуждать, а принять их как тестовый файл. Действительно качество лучше не обсуждать. К примеру, концентрация глюкозы выражена не понятно в каких единицах (по ВОЗ в ммоль/л), догадаться что речь о результатах теста на толерантность к глюкозе можно только посмотрев другой параметр (2-х часовой сывороточный инсулин), тогда становится ясно что ед. измерения глюкозы в приведенном примере - мг/дл. В случае проведения перорального глюкозотолерантного теста отправными являются следующие показатели: 1) Нормальная толерантность к глюкозе характеризуется уровнем гликемии через 2 ч после нагрузки глюкозой < 7,8 ммоль/л (<140 мг/дл). 2) Повышение концентрации глюкозы в плазме крови через 2 ч после нагрузки глюкозой до значений > 7,8 ммоль/л (>140 мг/дл), но < 11,1 ммоль/л (<200 мг/дл) свидетельствует о нарушенной толерантности к глюкозе. 3) Содержание глюкозы в плазме венозной крови через 2 ч после нагрузки глюкозой > 11,1 ммоль/л (> 200 мг/дл) может быть основанием для предварительного диагноза СД, который должен быть подтвержден повторными определениями. DrgLena Большое спасибо за комментарий. Cogito ergo sum
Nemo omnia potest scire |
|
29.05.2010 - 01:21
Сообщение
#18
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 6.02.2010 Из: Клайпеда Пользователь №: 10967 |
Для того чтобы выдавался свободный член, нужно набить ещё один столбец, заполненный одинаковым числом, и включить его в область анализа. Интуитивно это совсем непонятно, но описано в помощи к AtteStat. Когда тестировал этот модуль таким способом было полное совпадение с MedCalc, а десятичных знаков даже больше. Еще раз убедился в правоте слов Игоря, о том что у нас не принято утруждать себя прочтением manual`ов(я и сам это редко делаю). Действительно при введении дополнительного регрессора в область анализа получаются совсем другие результаты. Кроме указания на необходимость введения дополнит. регрессора в AtteStat есть и наглядный пример как это делать. Сообщение отредактировал Pyrosmani - 29.05.2010 - 10:12 Cogito ergo sum
Nemo omnia potest scire |
|
11.10.2010 - 06:45
Сообщение
#19
|
|
Группа: Пользователи Сообщений: 1 Регистрация: 11.10.2010 Пользователь №: 22811 |
Бинарная логистическая регрессия, мультивариантная, на выходе дает значение вероятности прогнозируемого события по множеству признаков. Например, у первого пациента в обсуждаемых данных р=0,72, а у второго только 0,049. Как правило, по результатам логистической регрессии, если расчетная вероятность выше, 0,50, то у больного диагностируют заболевание, а если меньше ? отсутствие заболевания. Т.о. по данным логистической регрессии (и использованием всех 8 предикторов, как представлено на сайте, а не только значимых) расчетная вероятность диабета находится в диапазоне от 0,00196 (?76) до 0,9926 (?446). Если бы точка разделения была 0,50, то ошибочно Получается, ROC кривая (при использовании более 1 предиктора) позволяет оценить только апостериори принадлежность пациента к той или иной группе, в противном случае, какая информативность значения точка разделения 0,33 на основании 8-ми предикторов? Что это дает, например, у нового больного? (если 1 предиктор, гликемия выше 200 - диабет - это понятно) |
|
11.10.2010 - 10:37
Сообщение
#20
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Нет, дочитайте до конца пост, который цитируете. Не имеет значения, сколько у вас предикторов. Нового больного вы классифицируете не по значению гликемии выше 200, а по значению расчетной вероятности диабета у этого больного. При этом вы сравниваете расчетную вероятность с оптимальной точкой разделения (вероятности, а не гликемии), при которой соотношение чувствительности и специфичности оптимальное.
В этой ветке обсуждался ROC после логистической регрессии, но он используется и без логистической регрессии для разделения по одному предиктору, тогда рассчитывают чувствительность и 1- специфичность при каждом значении предиктора (гликемии) и выбирается его оптимальное значение для разделения больных и здоровых и анализируют число ложноположительных и ложноотрицательных результатов |
|