Здравствуйте, гость ( Вход | Регистрация )
26.02.2009 - 20:00
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 26.02.2009 Пользователь №: 5862 |
Уважаемые коллеги!
Я новичок в статистике, поэтому заранее извинюсь за, быть может, наивные вопросы. Они касаются логистической регресии. Имеются данные некоторого потенциально значимого диагностического теста (read-out - да/нет, соотв. 0/1) для дифференциальной диагностики доброкачественных и злокачественных узловых образований ЩЖ (соотв-но, зависимая переменная - «зло»(1)/«добро»(0)), независимые переменные (помимо рез-та изучаемого теста) - пол, возраст и наличие/отсутствие (1/0) подозрительных на малигнизацию изменений на цитограмме пунктата. Строю модель (SPSS, binary logistic regession). В результате по переменной, соответствующей рез-там диагностического теста - гипердисперсия, низкая статистика Вальда и отсутствие значимости переменной. Ситуация в том, что тест высокоспецифичный (но низкочувствительный), и на относительно небольшой выборке ни одного тест-позитивного случая в группе пациентов с доброкачественными образованиями не наблюдается. При произвольном введении одного тест-позитива в эту группу (в любой case) ситуация полностью исправляется, ошибка становится вполне приемлемой и переменная становится значимой. При этом % верных предсказаний в «неадеватной» модели даже выше (что логично). Собственно вопросы: 1) Неадекватность модели при отсутствии тест-позитивных случаев в одной из групп - это внутренняя особенность алгоритма или еще что-то? 2) Если это внутренняя особенность алгоритма, то каковы методы борьбы (не считая дальнейшего сбора материала в ожидании хотя бы одного тест-позитивного случая)? Заранее спасибо за советы и рекомендации. Сообщение отредактировал lab_owl - 26.02.2009 - 20:05 |
|
|
![]() |
![]() |
![]() |
17.12.2011 - 19:51
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
критично ли для логрегрессии нарушения многомерного нормального распределения (имеется в виду распределение значений предикторов, конечно). Прелесть логистической регрессии в том и состоит, что предикторы могут быть и бинарные, тогда экспонента коэффициента (для одновариантной регрессии) совпадает с рассчитанной по четырехпольной таблице, а также и категориальными, реализовано в SPSS. А контроль модели - оценка ROC. |
|
|
![]() |
![]() |
18.12.2011 - 20:22
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 |
Прелесть логистической регрессии в том и состоит, что предикторы могут быть и бинарные, тогда экспонента коэффициента (для одновариантной регрессии) совпадает с рассчитанной по четырехпольной таблице, а также и категориальными, реализовано в SPSS. А контроль модели - оценка ROC. а вот кривую Колмогорова-Смирнова для оценки риска модели в SPSS не построишь ( может кто знает как syntax к ней написать Сообщение отредактировал Gewissta - 18.12.2011 - 20:27 |
|
|
![]() |
![]() |
18.12.2011 - 20:59
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
а вот кривую Колмогорова-Смирнова для оценки риска модели в SPSS не построишь ( может кто знает как syntax к ней написать Прошу вашего великодушного пардону, а что это за зверь такой - кривая Колмогорова-Смирнова? Просветите, когда не лень. Не дайте помереть полным болваном |
|
|
![]() |
![]() |
18.12.2011 - 21:16
Сообщение
#5
|
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 |
Прошу вашего великодушного пардону, а что это за зверь такой - кривая Колмогорова-Смирнова? Просветите, когда не лень. Не дайте помереть полным болваном Статистика КС вычисляется просто: это максимум разности между кумулятивным процентом распределения "хороших" заемщиков и кумулятивным процентом распределения "плохих" заемщиков (тут зависит от категорий зависимой переменной). Теоретически статистика КС может принимать значения от 0 до 100, однако на практике она обычно оказывается в диапазоне от 25 до 75. Примерная градация выглядит так: меньше 20 - наверное, скоринговая таблица непригодна к применению; 20-40 - неплохая таблица; 41-50 - хорошая таблица; 51-60 - очень хорошая таблица; 61-75 - поразительно хорошая таблица; больше 75 - вероятно, слишком хороший результат, чтобы быть правдой, наверное, что-то неправильно |
|
|
![]() |
![]() |
18.12.2011 - 21:40
Сообщение
#6
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Статистика КС вычисляется просто: это максимум разности между кумулятивным процентом распределения "хороших" заемщиков и кумулятивным процентом распределения "плохих" заемщиков (тут зависит от категорий зависимой переменной). Теоретически статистика КС может принимать значения от 0 до 100, однако на практике она обычно оказывается в диапазоне от 25 до 75. Примерная градация выглядит так: меньше 20 - наверное, скоринговая таблица непригодна к применению; 20-40 - неплохая таблица; 41-50 - хорошая таблица; 51-60 - очень хорошая таблица; 61-75 - поразительно хорошая таблица; больше 75 - вероятно, слишком хороший результат, чтобы быть правдой, наверное, что-то неправильно Вас понял: кривой Колмогорова-Смирнова в природе не существует. А говорить надо: "статистика типа Колмогорова - Смирнова", поскольку эти два ученых никогда не печатались вместе, не продолжали исследования друг друга, и не изучали один и тот же критерий ни вместе, ни порознь. Успехов в изучении матчасти! Сообщение отредактировал 100$ - 18.12.2011 - 21:42 |
|
|
![]() |
![]() |
18.12.2011 - 21:58
Сообщение
#7
|
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 |
Вас понял: кривой Колмогорова-Смирнова в природе не существует. А говорить надо: "статистика типа Колмогорова - Смирнова", поскольку эти два ученых никогда не печатались вместе, не продолжали исследования друг друга, и не изучали один и тот же критерий ни вместе, ни порознь. Успехов в изучении матчасти! В скоринге это общепринятый термин. http://www.plug-n-score.com/learning/kolmo...irnov-curve.htm а что и как они изучали порознь или вместе со Смирновым или в обнимку с Александровым (к которому у него были нежные чувства) мне неважно |
|
|
![]() |
![]() |
lab_owl Вопрос по логистической регрессии 26.02.2009 - 20:00
плав Цитата(lab_owl @ 26.02.2009 - 20:00)... 26.02.2009 - 21:48
lab_owl Спасибо большое за ответ!
Если можно, еще один... 27.02.2009 - 14:49
плав Цитата(lab_owl @ 27.02.2009 - 14:49)... 27.02.2009 - 17:34
lab_owl Спасибо большое!
Очень приятно что в рунете ес... 28.02.2009 - 00:00
lab_owl Здравствуйте,
Я опять к Вам с вопросами.
Получилас... 11.03.2009 - 06:05
плав На самом деле должны интересовать расчитанные при ... 11.03.2009 - 10:30
lab_owl Большое спасибо за ответы!
Единственное, я не ... 11.03.2009 - 19:29
плав Цитата(lab_owl @ 11.03.2009 - 19:29)... 11.03.2009 - 22:24
lab_owl Спасибо!
1) Т.е. алгоритм, насколько я понимаю... 12.03.2009 - 08:19
плав Цитата(lab_owl @ 12.03.2009 - 08:19)... 13.03.2009 - 00:11
lab_owl Видимо, из-за моего неполного понимания матчасти п... 13.03.2009 - 00:24
плав Цитата(lab_owl @ 13.03.2009 - 00:24)... 13.03.2009 - 19:11
lab_owl Спасибо огромное!
Под R подразумевается вот эт... 15.03.2009 - 03:58
Igoroshka Цитата(lab_owl @ 15.03.2009 - 02:58)... 15.03.2009 - 14:51
Gewissta привет профессионалам статистики! хочу спросит... 14.12.2011 - 16:53
Игорь Цитата(Gewissta @ 14.12.2011 - 17:53... 14.12.2011 - 19:29

Gewissta Цитата(Игорь @ 14.12.2011 - 20:29) Н... 14.12.2011 - 22:43


p2004r Цитата(Gewissta @ 14.12.2011 - 22:43... 14.12.2011 - 23:25



Gewissta Цитата(p2004r @ 15.12.2011 - 00:25) ... 15.12.2011 - 13:51



p2004r Цитата(Gewissta @ 15.12.2011 - 13:51... 15.12.2011 - 14:56


Игорь Цитата(Gewissta @ 14.12.2011 - 23:43... 17.12.2011 - 09:24


Gewissta Цитата(Игорь @ 17.12.2011 - 10:24) И... 17.12.2011 - 19:35


Игорь Цитата(Gewissta @ 17.12.2011 - 20:35... 18.12.2011 - 10:45

Gewissta Цитата(Игорь @ 14.12.2011 - 20:29) Н... 16.12.2011 - 20:49
Olga_ Цитата(Gewissta @ 14.12.2011 - 14:53... 4.01.2012 - 18:34
Вале а Цитата(Olga_ @ 4.01.2012 - 19:34) До... 9.01.2012 - 16:00
Игорь Цитата(Вале а @ 9.01.2012 - 16:00) д... 9.01.2012 - 16:39
Вале а Цитата(Игорь @ 9.01.2012 - 17:39) Пр... 10.01.2012 - 14:36
100$ Цитата(Gewissta @ 18.12.2011 - 21:58... 18.12.2011 - 22:30
Игорь Цитата(Gewissta @ 18.12.2011 - 22:58... 19.12.2011 - 15:14
Gewissta Цитата(Игорь @ 19.12.2011 - 15:14) О... 19.12.2011 - 18:16
DrgLena Не обязательно так реагировать на чьи то ошибки.
О... 19.12.2011 - 21:02
Игорь Цитата(DrgLena @ 19.12.2011 - 21:02)... 20.12.2011 - 06:02
DrgLena Игорь, вы изложили известные факты, мы это уже обс... 20.12.2011 - 12:46
100$ Цитата... а может называться и Kolmogorov-Smirnov-... 20.12.2011 - 17:16
Игорь Цитата(DrgLena @ 20.12.2011 - 13:46)... 20.12.2011 - 17:28
Gewissta Цитата(Игорь @ 20.12.2011 - 18:28) В... 20.12.2011 - 19:08
Gewissta Добрый день!
Строю в SPSS модель лог регрессии... 28.12.2011 - 16:27
p2004r Цитата(Gewissta @ 28.12.2011 - 16:27... 28.12.2011 - 20:34
p2004r Цитата(Gewissta @ 28.12.2011 - 16:27... 28.12.2011 - 20:40
Gewissta Цитата(p2004r @ 28.12.2011 - 21:40) ... 28.12.2011 - 21:05
DrgLena Цитата(Игорь @ 9.01.2012 - 17:39) Пр... 9.01.2012 - 19:08
Игорь Цитата(DrgLena @ 9.01.2012 - 19:08) ... 9.01.2012 - 20:15
DrgLena Я не спорю с вами в отношении числа градаций в пер... 9.01.2012 - 21:46
Игорь Цитата(DrgLena @ 9.01.2012 - 22:46) ... 10.01.2012 - 19:54
Вале а еще интересует, какие предположения могут быть выд... 10.01.2012 - 16:19
DrgLena Цитата(Игорь @ 10.01.2012 - 20:54) s... 11.01.2012 - 11:09
Игорь Цитата(DrgLena @ 11.01.2012 - 11:09)... 13.01.2012 - 05:39
DrgLena Цитата(Игорь @ 13.01.2012 - 05:39) .... 13.01.2012 - 10:56
Игорь Цитата(DrgLena @ 13.01.2012 - 10:56)... 13.01.2012 - 15:58
Вале а Цитата(Игорь @ 13.01.2012 - 16:58) д... 13.01.2012 - 21:43
DrgLena А в этой ветке форума пол (sex) всего лишь имя пер... 13.01.2012 - 11:28
DrgLena Прежде, чем вы уйдете, громко хлопнув дверью, сове... 13.01.2012 - 18:03
Stefa Здравствуйте, Игорь, не уходите, пожалуйста, с фор... 16.01.2012 - 05:22
Вале а Цитата(Stefa @ 16.01.2012 - 06:22) З... 16.01.2012 - 18:34
Вале а замерла веточка 7.02.2012 - 14:09![]() ![]() |