Вопрос по логистической регрессии |
Здравствуйте, гость ( Вход | Регистрация )
Вопрос по логистической регрессии |
14.12.2011 - 16:53
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 |
привет профессионалам статистики! хочу спросить, какие базовые предположения лежат в основе метода бинарной логистической регрессии. насколько она устойчива к нарушениям нормальности, гетероскедастичности? какими методами пользуйтесь при удалении/коррекции выбросов?
|
|
14.12.2011 - 19:29
Сообщение
#17
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
привет профессионалам статистики! хочу спросить, какие базовые предположения лежат в основе метода бинарной логистической регрессии. насколько она устойчива к нарушениям нормальности, гетероскедастичности? какими методами пользуйтесь при удалении/коррекции выбросов? Не профессионал, но тем не менее. Если Вас интересуют теоретические обоснования метода, то, во-первых, это довольно объемный материал. Во-вторых, движок форума не позволит (во всяком случае комфортно) использовать большое количество формул. Если Вам не хочется терять время, загляните в Справку программы AtteStat, касающуюся данного метода (доступна также в формате RTF) - там есть и теория, представленная в адекватном, но компактном виде, и даны все актуальные ссылки. Если хочется потроллить, продолжайте тему. Сообщение отредактировал Игорь - 14.12.2011 - 19:30 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
14.12.2011 - 22:43
Сообщение
#18
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 |
Не профессионал, но тем не менее. Если Вас интересуют теоретические обоснования метода, то, во-первых, это довольно объемный материал. Во-вторых, движок форума не позволит (во всяком случае комфортно) использовать большое количество формул. Если Вам не хочется терять время, загляните в Справку программы AtteStat, касающуюся данного метода (доступна также в формате RTF) - там есть и теория, представленная в адекватном, но компактном виде, и даны все актуальные ссылки. Если хочется потроллить, продолжайте тему. спор у нас с коллегой случился. критично ли для логрегрессии нарушения многомерного нормального распределения (имеется в виду распределение значений предикторов, конечно). и вообще справедливо для логрегрессии утверждать что остатки должны быть нормально распределены и гомоскедастичны? |
|
14.12.2011 - 23:25
Сообщение
#19
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
спор у нас с коллегой случился. критично ли для логрегрессии нарушения многомерного нормального распределения (имеется в виду распределение значений предикторов, конечно). и вообще справедливо для логрегрессии утверждать что остатки должны быть нормально распределены и гомоскедастичны? в том, насколько устойчиво полученное решение (полученное с помощью любого метода), очень легко убедится самому применив бутстреп |
|
15.12.2011 - 13:51
Сообщение
#20
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 |
|
|
15.12.2011 - 14:56
Сообщение
#21
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
в spss работа. там вроде нет такой возможности. если только spss syntax писать... изнутри последних версий spss по моему доступен R, логично использовать его если версия позволяет. |
|
16.12.2011 - 20:49
Сообщение
#22
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 |
Не профессионал, но тем не менее. Если Вас интересуют теоретические обоснования метода, то, во-первых, это довольно объемный материал. Во-вторых, движок форума не позволит (во всяком случае комфортно) использовать большое количество формул. Если Вам не хочется терять время, загляните в Справку программы AtteStat, касающуюся данного метода (доступна также в формате RTF) - там есть и теория, представленная в адекватном, но компактном виде, и даны все актуальные ссылки. Если хочется потроллить, продолжайте тему. не нашел справку в rtf а программку установил. справка не запускается, ругается: сделана в допотопные времена и капризная виста ее понимать не хочет. может сылочку на файлик кинете плиз? еще вопрос, в литературе встретил информацию по коэффициенту детерминации: в ряде случаев плохо подогнанная модель давала тем не менее высокий коэфф-т детерминации, увеличение коэфф-та с включением предиктора еще не обозначает что его коэффициент значим. http://www.ekon.oglib.ru/bgl/3619/95.html насколько это справедливо для логистической регресcии? |
|
17.12.2011 - 09:24
Сообщение
#23
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
спор у нас с коллегой случился. критично ли для логрегрессии нарушения многомерного нормального распределения (имеется в виду распределение значений предикторов, конечно). и вообще справедливо для логрегрессии утверждать что остатки должны быть нормально распределены и гомоскедастичны? Интуитивно (возможно и даже очень вероятно, это показано в литературе) можно предположить, что чем ближе распределение предикторов к нормальному распределению, тем более адекватную модель удастся получить. не нашел справку в rtf а программку установил. справка не запускается, ругается: сделана в допотопные времена и капризная виста ее понимать не хочет. может сылочку на файлик кинете плиз? Если Вы грузили программу с официального сайта, там же расположены исходные тексты программы, в которых искомые файлы RTF находятся. Vista при первом запуске должна была сообщить, где и как получить программу для чтения файлов в формате HLP. Купив программное обеспечение у компании Microsoft, Вы оплатили и его поддержку. Так воспользуйтесь своим правом получить ее от продавца. Сообщение отредактировал Игорь - 17.12.2011 - 09:33 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
17.12.2011 - 19:35
Сообщение
#24
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 |
Интуитивно (возможно и даже очень вероятно, это показано в литературе) можно предположить, что чем ближе распределение предикторов к нормальному распределению, тем более адекватную модель удастся получить. Если Вы грузили программу с официального сайта, там же расположены исходные тексты программы, в которых искомые файлы RTF находятся. Vista при первом запуске должна была сообщить, где и как получить программу для чтения файлов в формате HLP. Купив программное обеспечение у компании Microsoft, Вы оплатили и его поддержку. Так воспользуйтесь своим правом получить ее от продавца. это официальный сайт - http://www.attestat.valsoft.ru? |
|
17.12.2011 - 19:51
Сообщение
#25
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
критично ли для логрегрессии нарушения многомерного нормального распределения (имеется в виду распределение значений предикторов, конечно). Прелесть логистической регрессии в том и состоит, что предикторы могут быть и бинарные, тогда экспонента коэффициента (для одновариантной регрессии) совпадает с рассчитанной по четырехпольной таблице, а также и категориальными, реализовано в SPSS. А контроль модели - оценка ROC. |
|
18.12.2011 - 10:45
Сообщение
#26
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
18.12.2011 - 20:22
Сообщение
#27
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 |
Прелесть логистической регрессии в том и состоит, что предикторы могут быть и бинарные, тогда экспонента коэффициента (для одновариантной регрессии) совпадает с рассчитанной по четырехпольной таблице, а также и категориальными, реализовано в SPSS. А контроль модели - оценка ROC. а вот кривую Колмогорова-Смирнова для оценки риска модели в SPSS не построишь ( может кто знает как syntax к ней написать Сообщение отредактировал Gewissta - 18.12.2011 - 20:27 |
|
18.12.2011 - 20:59
Сообщение
#28
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
а вот кривую Колмогорова-Смирнова для оценки риска модели в SPSS не построишь ( может кто знает как syntax к ней написать Прошу вашего великодушного пардону, а что это за зверь такой - кривая Колмогорова-Смирнова? Просветите, когда не лень. Не дайте помереть полным болваном |
|
18.12.2011 - 21:16
Сообщение
#29
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 29.10.2011 Из: Екатеринбург Пользователь №: 23265 |
Прошу вашего великодушного пардону, а что это за зверь такой - кривая Колмогорова-Смирнова? Просветите, когда не лень. Не дайте помереть полным болваном Статистика КС вычисляется просто: это максимум разности между кумулятивным процентом распределения "хороших" заемщиков и кумулятивным процентом распределения "плохих" заемщиков (тут зависит от категорий зависимой переменной). Теоретически статистика КС может принимать значения от 0 до 100, однако на практике она обычно оказывается в диапазоне от 25 до 75. Примерная градация выглядит так: меньше 20 - наверное, скоринговая таблица непригодна к применению; 20-40 - неплохая таблица; 41-50 - хорошая таблица; 51-60 - очень хорошая таблица; 61-75 - поразительно хорошая таблица; больше 75 - вероятно, слишком хороший результат, чтобы быть правдой, наверное, что-то неправильно |
|
18.12.2011 - 21:40
Сообщение
#30
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Статистика КС вычисляется просто: это максимум разности между кумулятивным процентом распределения "хороших" заемщиков и кумулятивным процентом распределения "плохих" заемщиков (тут зависит от категорий зависимой переменной). Теоретически статистика КС может принимать значения от 0 до 100, однако на практике она обычно оказывается в диапазоне от 25 до 75. Примерная градация выглядит так: меньше 20 - наверное, скоринговая таблица непригодна к применению; 20-40 - неплохая таблица; 41-50 - хорошая таблица; 51-60 - очень хорошая таблица; 61-75 - поразительно хорошая таблица; больше 75 - вероятно, слишком хороший результат, чтобы быть правдой, наверное, что-то неправильно Вас понял: кривой Колмогорова-Смирнова в природе не существует. А говорить надо: "статистика типа Колмогорова - Смирнова", поскольку эти два ученых никогда не печатались вместе, не продолжали исследования друг друга, и не изучали один и тот же критерий ни вместе, ни порознь. Успехов в изучении матчасти! Сообщение отредактировал 100$ - 18.12.2011 - 21:42 |
|