Здравствуйте, гость ( Вход | Регистрация )
21.08.2016 - 01:20
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 21.08.2016 Пользователь №: 28570 |
Подскажите, пожалуйста, как интерпретировать случаи, если бинарная логистическая регрессия дала значимые результаты:
хи квадрат значим, независимые переменные значимы, общее число корректно предсказанных случаев по модели более 70, а правильно предсказанных более 50,% но доля объясненной дисперсии (R2 Наделькеркеса) - менее 0,500. Модель работает? какой из показателей (% предсказанных или дисперсия более важный?) Правильно ли я понимаю, что даже, если R2 менее 0,5, это значит, что по модели прогнозирование лучше, чем наугад. в сообщениях ниже вопрос был отредактирован |
|
|
![]() |
![]() |
![]() |
27.08.2016 - 00:28
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 21.08.2016 Пользователь №: 28570 |
Благодаря замечаниям и советам форумчан медленно, но верно продвигаюсь.
Внесу коррективы в поставленный вопрос: Спасибо всем за терпение к моим ошибкам. Обнаружила в учебнике Орловой И.В. и др. Многомерный статистический анализ в экономических задачах: компьютерное моделирование в SPSS .2009. указание на то, что R2 - редко используется для анализа моделей, поэтому автор не останавливается на подробном описании его возможных вариаций. так ли это? если у кого-то есть ссылка на какой-либо источник по этому поводу буду признательна. [attachment=1381:характер..._кривыми.doc] в прикрепленном файле характеристики трех моделей и ROC-кривые (уже исправленные). Можно ли с учетом представленных данных в файле сделать заключение и каким оно будет? Сообщение отредактировал marchanka - 27.08.2016 - 17:06 |
|
|
![]() |
![]() |
27.08.2016 - 11:13
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Благодаря замечаниям и советам форумчан медленно, но верно продвигаюсь. Внесу коррективы в поставленный вопрос: Спасибо всем за терпение к моим ошибкам. Обнаружила в учебнике Орловой И.В. и др. Многомерный статистический анализ в экономических задачах: компьютерное моделирование в SPSS .2009. указание на то, что R2 - редко используется для анализа моделей, поэтому автор не останавливается на подробном описании его возможных вариаций. так ли это? если у кого-то есть ссылка на какой-либо источник по этому поводу буду признательна. [attachment=1381:характер..._кривыми.doc] в прикрепленном файле характеристики трех моделей и ROC-кривые (уже исправленные). Можно ли с учетом представленных данных в файле сделать заключение и каким оно будет? прикреплю ссылку на автореферат, где представлены данные лог.регрессии. мне его выдали для ориентировки. Корректны ли здесь представления моделей и их интерпретация? 0. Никогда не провоцируйте обсуждение на форумах не своих результатов без явного согласия их авторов. 1. Вы не внимательно читаете что Вам советуют (в данном случае я И R^2 и тем более ROC прекрасные критерии оценки _качества_ модели, которая _интерполирует_ данные эксперимента-наблюдения. Но все эти критерии (и даже попытки в них вносить поправки), и даже Информационные критерии откровенно слабо позволяют оценить _экстраполяционные_ возможности модели (то есть возможность _точно_ предсказывать для не участвовавших в обучении случаев). Если модель не состоятельна в смысле экстраполяции это называют "переобучение"-"оверфитинг-переподгонка". В этом случае трактовать смысл коэффициентов модели любого вида становиться так же продуктивно, как трактовать смысл коэффициентов полинома наилучшим образом описывающего анализируемый набор данных. По этому еще раз --- кроссвалидация позволяет получить модель любого вида без переобучения имеющее оптимальное качество по любому выбранному параметру (Хоть AUC, хоть R^2, хоть ....). Достигнутое качество (фактически его распределение) модели для данной структуры модели и является значимым. Естественно есть масса процедур построенных "вокруг кроссвалидации", которые "ищут" эту самую оптимальную структуру модели + значимость предикторов для данной независимой величины. Сообщение отредактировал p2004r - 27.08.2016 - 18:02 ![]() |
|
|
![]() |
![]() |
marchanka Интерпретация данных логистической регрессии 21.08.2016 - 01:20
ogurtsov Цитата(marchanka @ 21.08.2016 - 01:2... 21.08.2016 - 07:26
marchanka Цитата(ogurtsov @ 21.08.2016 - 07:26... 21.08.2016 - 10:37
p2004r Цитата(marchanka @ 21.08.2016 - 01:2... 21.08.2016 - 09:58
marchanka Цитата(p2004r @ 21.08.2016 - 09:58) ... 21.08.2016 - 11:58
p2004r Цитата(marchanka @ 21.08.2016 - 11:5... 22.08.2016 - 00:54
marchanka [quote name='p2004r' post='20101' ... 22.08.2016 - 20:37
p2004r 1. В K2 надо поменять "смысл исходов", ч... 23.08.2016 - 15:42
marchanka Ответила вам в лс. 22.08.2016 - 19:31
marchanka Правильно ли я поняла, что модели можно содержател... 23.08.2016 - 22:04
p2004r Цитата(marchanka @ 23.08.2016 - 22:0... 24.08.2016 - 12:39
marchanka Цитата(p2004r @ 24.08.2016 - 12:39) ... 25.08.2016 - 09:41
p2004r Цитата(marchanka @ 25.08.2016 - 09:4... 25.08.2016 - 19:32
marchanka Цитата(p2004r @ 25.08.2016 - 19:32) ... 26.08.2016 - 23:24
leo_biostat Цитата(p2004r @ 25.08.2016 - 19:32) ... 25.11.2016 - 20:52
DrgLena Цитата(marchanka @ 25.08.2016 - 09:4... 26.08.2016 - 13:21
marchanka Цитата(DrgLena @ 26.08.2016 - 13:21)... 26.08.2016 - 23:22
marchanka Цитата(p2004r @ 27.08.2016 - 11:13) ... 27.08.2016 - 17:13
p2004r Цитата(marchanka @ 27.08.2016 - 17:1... 27.08.2016 - 18:16
marchanka Цитата(p2004r @ 27.08.2016 - 18:16) ... 27.08.2016 - 21:09
DrgLena Marchanka, вы спрашиваете, какое заключение можно ... 28.08.2016 - 12:00![]() ![]() |