Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Интерпретация данных логистической регрессии
marchanka
сообщение 21.08.2016 - 01:20
Сообщение #1





Группа: Пользователи
Сообщений: 12
Регистрация: 21.08.2016
Пользователь №: 28570



Подскажите, пожалуйста, как интерпретировать случаи, если бинарная логистическая регрессия дала значимые результаты:
хи квадрат значим, независимые переменные значимы, общее число корректно предсказанных случаев по модели более 70,
а правильно предсказанных более 50,% но доля объясненной дисперсии (R2 Наделькеркеса) - менее 0,500.
Модель работает? какой из показателей (% предсказанных или дисперсия более важный?)
Правильно ли я понимаю, что даже, если R2 менее 0,5, это значит, что по модели прогнозирование лучше, чем наугад.

в сообщениях ниже вопрос был отредактирован
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
p2004r
сообщение 21.08.2016 - 09:58
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(marchanka @ 21.08.2016 - 01:20) *
Подскажите, пожалуйста, как интерпретировать случаи, если бинарная логистическая регрессия дала значимые результаты: хи квадрат значим, независимые переменные значимы, общее число корректно предсказанных случаев по модели более 70, а правильно предсказанных более 50,% но доля объясненной дисперсии (R2 Наделькеркеса)-менее 0,500.
Модель работает? какой из показателей (% предсказанных или дисперсия более важный?)
Правильно ли я понимаю, что даже, если R2 менее 0,5, это значит, что по модели прогнозирование лучше, чем наугад.


Надо построить ROC и провести её анализ. Искать есть ли в зависимости эффективный трешоилд. Это если тонко.

А если интересует "абстрактная предсказательная сила" то посчитать доверительный интервал для AUC.



Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
marchanka
сообщение 21.08.2016 - 11:58
Сообщение #3





Группа: Пользователи
Сообщений: 12
Регистрация: 21.08.2016
Пользователь №: 28570



Цитата(p2004r @ 21.08.2016 - 09:58) *
Надо построить ROC и провести её анализ. Искать есть ли в зависимости эффективный трешоилд. Это если тонко.

А если интересует "абстрактная предсказательная сила" то посчитать доверительный интервал для AUC.



построила ROC.
я так понимаю, что смотреть надо на AUC. если 05-0,6 - модель неудовлетворительная.
возникает два допольнительных вопроса:
1) надо ли при этом учитывать % корректно предсказанных случаев по обучающей и контрольной моделям? (но я так и не поняла, что это за модели).
2) показатель AUC используется для сравнения двух моделей? или с его помощью можно оценить и надежность модели в целом (самой по себе)?

есть одна модель с такими показателями:
обучающая модель % предсказанных 1 з.переменной 100%, 2-ой категории з.переменной 0%, А ОБЩИЙ 60%
В КОНТРольной модели: 100%, 0%, общий 70,6
а AUC. 0,758

в свою очередь в бинарной регрессии для этой модели сделующие характеристики:
χ2 = 21,895, р=0,001, – 2 LL=68,460, R2 Нэйджелкерка = 0,372
% корректно предсказанных случаев =72 , % корректно предсказанных всего=79,7

Сообщение отредактировал marchanka - 21.08.2016 - 12:41
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 22.08.2016 - 00:54
Сообщение #4





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(marchanka @ 21.08.2016 - 11:58) *
построила ROC.

а AUC. 0,758


1. Где этот ROC? (сюда прекрасно атачатся картинки)

2. Доверительный интервал у AUC какой?


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
marchanka
сообщение 22.08.2016 - 20:37
Сообщение #5





Группа: Пользователи
Сообщений: 12
Регистрация: 21.08.2016
Пользователь №: 28570



[quote name='p2004r' post='20101' date='22.08.2016 - 00:54']1. Где этот ROC? (сюда прекрасно атачатся картинки)


Загрузила файл с описанием моделей.

Мне важно понять общий принцип анализа:
по AUC нашла следующий вариант оценки моделей
Интервал AUC Качество модели
0.9-1.0 Отличное
0.8-0.9 Очень хорошее
0.7-0.8 Хорошее
0.6-0.7 Среднее
0.5-0.6 Неудовлетворительное (https://basegroup.ru/community/articles/logistic)

По оценке доверительного интервала прошу уточнить критерии оценки.

[attachment=1380:регресси..._модели2.doc]

Сообщение отредактировал marchanka - 23.08.2016 - 00:41
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 23.08.2016 - 15:42
Сообщение #6





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699





1. В K2 надо поменять "смысл исходов", что бы ROC "прошла над диагональю". Это "чисто косметически".

2. Надежность моделей это не совсем ROC анализ. Он только позволяет оценить "характеристики надежности" решения, но надежность как таковая немного шире. Надежность модели придется кроссвалидацией определить до того как строить по решению ROC (или использовать на свой страх и риск метод практически "не чувствительный" к переобучению). Скорее всего используемый пакет что там такое должен иметь встроенное при поиске "оптимальной" модели.

3. Тесты сравнивающие несколько AUC между собой есть, если я правильно понял вопрос в файле.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- marchanka   Интерпретация данных логистической регрессии   21.08.2016 - 01:20
- - ogurtsov   Цитата(marchanka @ 21.08.2016 - 01:2...   21.08.2016 - 07:26
|- - marchanka   Цитата(ogurtsov @ 21.08.2016 - 07:26...   21.08.2016 - 10:37
- - p2004r   Цитата(marchanka @ 21.08.2016 - 01:2...   21.08.2016 - 09:58
|- - marchanka   Цитата(p2004r @ 21.08.2016 - 09:58) ...   21.08.2016 - 11:58
|- - p2004r   Цитата(marchanka @ 21.08.2016 - 11:5...   22.08.2016 - 00:54
|- - marchanka   [quote name='p2004r' post='20101' ...   22.08.2016 - 20:37
|- - p2004r   1. В K2 надо поменять "смысл исходов", ч...   23.08.2016 - 15:42
- - marchanka   Ответила вам в лс.   22.08.2016 - 19:31
- - marchanka   Правильно ли я поняла, что модели можно содержател...   23.08.2016 - 22:04
|- - p2004r   Цитата(marchanka @ 23.08.2016 - 22:0...   24.08.2016 - 12:39
|- - marchanka   Цитата(p2004r @ 24.08.2016 - 12:39) ...   25.08.2016 - 09:41
|- - p2004r   Цитата(marchanka @ 25.08.2016 - 09:4...   25.08.2016 - 19:32
|- - marchanka   Цитата(p2004r @ 25.08.2016 - 19:32) ...   26.08.2016 - 23:24
|- - leo_biostat   Цитата(p2004r @ 25.08.2016 - 19:32) ...   25.11.2016 - 20:52
- - DrgLena   Цитата(marchanka @ 25.08.2016 - 09:4...   26.08.2016 - 13:21
|- - marchanka   Цитата(DrgLena @ 26.08.2016 - 13:21)...   26.08.2016 - 23:22
- - marchanka   Благодаря замечаниям и советам форумчан медленно, ...   27.08.2016 - 00:28
|- - p2004r   Цитата(marchanka @ 27.08.2016 - 00:2...   27.08.2016 - 11:13
|- - marchanka   Цитата(p2004r @ 27.08.2016 - 11:13) ...   27.08.2016 - 17:13
|- - p2004r   Цитата(marchanka @ 27.08.2016 - 17:1...   27.08.2016 - 18:16
|- - marchanka   Цитата(p2004r @ 27.08.2016 - 18:16) ...   27.08.2016 - 21:09
- - DrgLena   Marchanka, вы спрашиваете, какое заключение можно ...   28.08.2016 - 12:00


Добавить ответ в эту темуОткрыть тему