Вопрос по логистической регрессии |
Здравствуйте, гость ( Вход | Регистрация )
Вопрос по логистической регрессии |
26.02.2009 - 20:00
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 26.02.2009 Пользователь №: 5862 |
Уважаемые коллеги!
Я новичок в статистике, поэтому заранее извинюсь за, быть может, наивные вопросы. Они касаются логистической регресии. Имеются данные некоторого потенциально значимого диагностического теста (read-out - да/нет, соотв. 0/1) для дифференциальной диагностики доброкачественных и злокачественных узловых образований ЩЖ (соотв-но, зависимая переменная - «зло»(1)/«добро»(0)), независимые переменные (помимо рез-та изучаемого теста) - пол, возраст и наличие/отсутствие (1/0) подозрительных на малигнизацию изменений на цитограмме пунктата. Строю модель (SPSS, binary logistic regession). В результате по переменной, соответствующей рез-там диагностического теста - гипердисперсия, низкая статистика Вальда и отсутствие значимости переменной. Ситуация в том, что тест высокоспецифичный (но низкочувствительный), и на относительно небольшой выборке ни одного тест-позитивного случая в группе пациентов с доброкачественными образованиями не наблюдается. При произвольном введении одного тест-позитива в эту группу (в любой case) ситуация полностью исправляется, ошибка становится вполне приемлемой и переменная становится значимой. При этом % верных предсказаний в «неадеватной» модели даже выше (что логично). Собственно вопросы: 1) Неадекватность модели при отсутствии тест-позитивных случаев в одной из групп - это внутренняя особенность алгоритма или еще что-то? 2) Если это внутренняя особенность алгоритма, то каковы методы борьбы (не считая дальнейшего сбора материала в ожидании хотя бы одного тест-позитивного случая)? Заранее спасибо за советы и рекомендации. Сообщение отредактировал lab_owl - 26.02.2009 - 20:05 |
|
14.12.2011 - 16:53
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 |
привет профессионалам статистики! хочу спросить, какие базовые предположения лежат в основе метода бинарной логистической регрессии. насколько она устойчива к нарушениям нормальности, гетероскедастичности? какими методами пользуйтесь при удалении/коррекции выбросов?
|
|
14.12.2011 - 19:29
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
привет профессионалам статистики! хочу спросить, какие базовые предположения лежат в основе метода бинарной логистической регрессии. насколько она устойчива к нарушениям нормальности, гетероскедастичности? какими методами пользуйтесь при удалении/коррекции выбросов? Не профессионал, но тем не менее. Если Вас интересуют теоретические обоснования метода, то, во-первых, это довольно объемный материал. Во-вторых, движок форума не позволит (во всяком случае комфортно) использовать большое количество формул. Если Вам не хочется терять время, загляните в Справку программы AtteStat, касающуюся данного метода (доступна также в формате RTF) - там есть и теория, представленная в адекватном, но компактном виде, и даны все актуальные ссылки. Если хочется потроллить, продолжайте тему. Сообщение отредактировал Игорь - 14.12.2011 - 19:30 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
14.12.2011 - 22:43
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 |
Не профессионал, но тем не менее. Если Вас интересуют теоретические обоснования метода, то, во-первых, это довольно объемный материал. Во-вторых, движок форума не позволит (во всяком случае комфортно) использовать большое количество формул. Если Вам не хочется терять время, загляните в Справку программы AtteStat, касающуюся данного метода (доступна также в формате RTF) - там есть и теория, представленная в адекватном, но компактном виде, и даны все актуальные ссылки. Если хочется потроллить, продолжайте тему. спор у нас с коллегой случился. критично ли для логрегрессии нарушения многомерного нормального распределения (имеется в виду распределение значений предикторов, конечно). и вообще справедливо для логрегрессии утверждать что остатки должны быть нормально распределены и гомоскедастичны? |
|