![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 26.02.2009 Пользователь №: 5862 ![]() |
Уважаемые коллеги!
Я новичок в статистике, поэтому заранее извинюсь за, быть может, наивные вопросы. Они касаются логистической регресии. Имеются данные некоторого потенциально значимого диагностического теста (read-out - да/нет, соотв. 0/1) для дифференциальной диагностики доброкачественных и злокачественных узловых образований ЩЖ (соотв-но, зависимая переменная - «зло»(1)/«добро»(0)), независимые переменные (помимо рез-та изучаемого теста) - пол, возраст и наличие/отсутствие (1/0) подозрительных на малигнизацию изменений на цитограмме пунктата. Строю модель (SPSS, binary logistic regession). В результате по переменной, соответствующей рез-там диагностического теста - гипердисперсия, низкая статистика Вальда и отсутствие значимости переменной. Ситуация в том, что тест высокоспецифичный (но низкочувствительный), и на относительно небольшой выборке ни одного тест-позитивного случая в группе пациентов с доброкачественными образованиями не наблюдается. При произвольном введении одного тест-позитива в эту группу (в любой case) ситуация полностью исправляется, ошибка становится вполне приемлемой и переменная становится значимой. При этом % верных предсказаний в «неадеватной» модели даже выше (что логично). Собственно вопросы: 1) Неадекватность модели при отсутствии тест-позитивных случаев в одной из групп - это внутренняя особенность алгоритма или еще что-то? 2) Если это внутренняя особенность алгоритма, то каковы методы борьбы (не считая дальнейшего сбора материала в ожидании хотя бы одного тест-позитивного случая)? Заранее спасибо за советы и рекомендации. Сообщение отредактировал lab_owl - 26.02.2009 - 20:05 |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 ![]() |
критично ли для логрегрессии нарушения многомерного нормального распределения (имеется в виду распределение значений предикторов, конечно). Прелесть логистической регрессии в том и состоит, что предикторы могут быть и бинарные, тогда экспонента коэффициента (для одновариантной регрессии) совпадает с рассчитанной по четырехпольной таблице, а также и категориальными, реализовано в SPSS. А контроль модели - оценка ROC. |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 ![]() |
Прелесть логистической регрессии в том и состоит, что предикторы могут быть и бинарные, тогда экспонента коэффициента (для одновариантной регрессии) совпадает с рассчитанной по четырехпольной таблице, а также и категориальными, реализовано в SPSS. А контроль модели - оценка ROC. а вот кривую Колмогорова-Смирнова для оценки риска модели в SPSS не построишь ( может кто знает как syntax к ней написать Сообщение отредактировал Gewissta - 18.12.2011 - 20:27 |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
а вот кривую Колмогорова-Смирнова для оценки риска модели в SPSS не построишь ( может кто знает как syntax к ней написать Прошу вашего великодушного пардону, а что это за зверь такой - кривая Колмогорова-Смирнова? Просветите, когда не лень. Не дайте помереть полным болваном ![]() |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 ![]() |
Прошу вашего великодушного пардону, а что это за зверь такой - кривая Колмогорова-Смирнова? Просветите, когда не лень. Не дайте помереть полным болваном ![]() Статистика КС вычисляется просто: это максимум разности между кумулятивным процентом распределения "хороших" заемщиков и кумулятивным процентом распределения "плохих" заемщиков (тут зависит от категорий зависимой переменной). Теоретически статистика КС может принимать значения от 0 до 100, однако на практике она обычно оказывается в диапазоне от 25 до 75. Примерная градация выглядит так: меньше 20 - наверное, скоринговая таблица непригодна к применению; 20-40 - неплохая таблица; 41-50 - хорошая таблица; 51-60 - очень хорошая таблица; 61-75 - поразительно хорошая таблица; больше 75 - вероятно, слишком хороший результат, чтобы быть правдой, наверное, что-то неправильно |
|
![]() |
![]() |
![]()
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
Статистика КС вычисляется просто: это максимум разности между кумулятивным процентом распределения "хороших" заемщиков и кумулятивным процентом распределения "плохих" заемщиков (тут зависит от категорий зависимой переменной). Теоретически статистика КС может принимать значения от 0 до 100, однако на практике она обычно оказывается в диапазоне от 25 до 75. Примерная градация выглядит так: меньше 20 - наверное, скоринговая таблица непригодна к применению; 20-40 - неплохая таблица; 41-50 - хорошая таблица; 51-60 - очень хорошая таблица; 61-75 - поразительно хорошая таблица; больше 75 - вероятно, слишком хороший результат, чтобы быть правдой, наверное, что-то неправильно Вас понял: кривой Колмогорова-Смирнова в природе не существует. А говорить надо: "статистика типа Колмогорова - Смирнова", поскольку эти два ученых никогда не печатались вместе, не продолжали исследования друг друга, и не изучали один и тот же критерий ни вместе, ни порознь. Успехов в изучении матчасти! Сообщение отредактировал 100$ - 18.12.2011 - 21:42 |
|
![]() |
![]() |
![]()
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 ![]() |
Вас понял: кривой Колмогорова-Смирнова в природе не существует. А говорить надо: "статистика типа Колмогорова - Смирнова", поскольку эти два ученых никогда не печатались вместе, не продолжали исследования друг друга, и не изучали один и тот же критерий ни вместе, ни порознь. Успехов в изучении матчасти! В скоринге это общепринятый термин. http://www.plug-n-score.com/learning/kolmo...irnov-curve.htm а что и как они изучали порознь или вместе со Смирновым или в обнимку с Александровым (к которому у него были нежные чувства) мне неважно |
|
![]() |
![]() |
![]()
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
В скоринге это общепринятый термин. http://www.plug-n-score.com/learning/kolmo...irnov-curve.htm а что и как они изучали порознь или вместе со Смирновым или в обнимку с Александровым (к которому у него были нежные чувства) мне неважно То есть я вам - медицинский факт, что ни Колмогоров, ни Смирнов никаких кривых Колмогорова-Смирнова отродясь не выдумывали, а вы мне - ссылку на официальный сайт племени мумбо-юмбо, которые русского языка не знают, трудов Колмогорова и Смирнова в глаза не видели. Забавно. Пишите исчо. Не бросайте меня надолго. |
|
![]() |
![]() |
![]() ![]() |