Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

5 страниц V  < 1 2 3 4 > »   
Добавить ответ в эту темуОткрыть тему
> Вопрос по логистической регрессии
Gewissta
сообщение 14.12.2011 - 16:53
Сообщение #16





Группа: Пользователи
Сообщений: 14
Регистрация: 29.10.2011
Из: Екатеринбург
Пользователь №: 23265



привет профессионалам статистики! хочу спросить, какие базовые предположения лежат в основе метода бинарной логистической регрессии. насколько она устойчива к нарушениям нормальности, гетероскедастичности? какими методами пользуйтесь при удалении/коррекции выбросов?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 14.12.2011 - 19:29
Сообщение #17





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Gewissta @ 14.12.2011 - 17:53) *
привет профессионалам статистики! хочу спросить, какие базовые предположения лежат в основе метода бинарной логистической регрессии. насколько она устойчива к нарушениям нормальности, гетероскедастичности? какими методами пользуйтесь при удалении/коррекции выбросов?

Не профессионал, но тем не менее. Если Вас интересуют теоретические обоснования метода, то, во-первых, это довольно объемный материал. Во-вторых, движок форума не позволит (во всяком случае комфортно) использовать большое количество формул. Если Вам не хочется терять время, загляните в Справку программы AtteStat, касающуюся данного метода (доступна также в формате RTF) - там есть и теория, представленная в адекватном, но компактном виде, и даны все актуальные ссылки. Если хочется потроллить, продолжайте тему.

Сообщение отредактировал Игорь - 14.12.2011 - 19:30


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Gewissta
сообщение 14.12.2011 - 22:43
Сообщение #18





Группа: Пользователи
Сообщений: 14
Регистрация: 29.10.2011
Из: Екатеринбург
Пользователь №: 23265



Цитата(Игорь @ 14.12.2011 - 20:29) *
Не профессионал, но тем не менее. Если Вас интересуют теоретические обоснования метода, то, во-первых, это довольно объемный материал. Во-вторых, движок форума не позволит (во всяком случае комфортно) использовать большое количество формул. Если Вам не хочется терять время, загляните в Справку программы AtteStat, касающуюся данного метода (доступна также в формате RTF) - там есть и теория, представленная в адекватном, но компактном виде, и даны все актуальные ссылки. Если хочется потроллить, продолжайте тему.


спор у нас с коллегой случился. критично ли для логрегрессии нарушения многомерного нормального распределения (имеется в виду распределение значений предикторов, конечно). и вообще справедливо для логрегрессии утверждать что остатки должны быть нормально распределены и гомоскедастичны?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 14.12.2011 - 23:25
Сообщение #19





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Gewissta @ 14.12.2011 - 22:43) *
спор у нас с коллегой случился. критично ли для логрегрессии нарушения многомерного нормального распределения (имеется в виду распределение значений предикторов, конечно). и вообще справедливо для логрегрессии утверждать что остатки должны быть нормально распределены и гомоскедастичны?


в том, насколько устойчиво полученное решение (полученное с помощью любого метода), очень легко убедится самому применив бутстреп



Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Gewissta
сообщение 15.12.2011 - 13:51
Сообщение #20





Группа: Пользователи
Сообщений: 14
Регистрация: 29.10.2011
Из: Екатеринбург
Пользователь №: 23265



Цитата(p2004r @ 15.12.2011 - 00:25) *
в том, насколько устойчиво полученное решение (полученное с помощью любого метода), очень легко убедится самому применив бутстреп


в spss работа. там вроде нет такой возможности. если только spss syntax писать...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 15.12.2011 - 14:56
Сообщение #21





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Gewissta @ 15.12.2011 - 13:51) *
в spss работа. там вроде нет такой возможности. если только spss syntax писать...


изнутри последних версий spss по моему доступен R, логично использовать его если версия позволяет.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Gewissta
сообщение 16.12.2011 - 20:49
Сообщение #22





Группа: Пользователи
Сообщений: 14
Регистрация: 29.10.2011
Из: Екатеринбург
Пользователь №: 23265



Цитата(Игорь @ 14.12.2011 - 20:29) *
Не профессионал, но тем не менее. Если Вас интересуют теоретические обоснования метода, то, во-первых, это довольно объемный материал. Во-вторых, движок форума не позволит (во всяком случае комфортно) использовать большое количество формул. Если Вам не хочется терять время, загляните в Справку программы AtteStat, касающуюся данного метода (доступна также в формате RTF) - там есть и теория, представленная в адекватном, но компактном виде, и даны все актуальные ссылки. Если хочется потроллить, продолжайте тему.


не нашел справку в rtf а программку установил. справка не запускается, ругается: сделана в допотопные времена и капризная виста ее понимать не хочет. может сылочку на файлик кинете плиз?
еще вопрос, в литературе встретил информацию по коэффициенту детерминации: в ряде случаев плохо подогнанная модель давала тем не менее высокий коэфф-т детерминации, увеличение коэфф-та с включением предиктора еще не обозначает что его коэффициент значим.
http://www.ekon.oglib.ru/bgl/3619/95.html
насколько это справедливо для логистической регресcии?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 17.12.2011 - 09:24
Сообщение #23





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Gewissta @ 14.12.2011 - 23:43) *
спор у нас с коллегой случился. критично ли для логрегрессии нарушения многомерного нормального распределения (имеется в виду распределение значений предикторов, конечно). и вообще справедливо для логрегрессии утверждать что остатки должны быть нормально распределены и гомоскедастичны?

Интуитивно (возможно и даже очень вероятно, это показано в литературе) можно предположить, что чем ближе распределение предикторов к нормальному распределению, тем более адекватную модель удастся получить.
Цитата(Gewissta @ 16.12.2011 - 21:49) *
не нашел справку в rtf а программку установил. справка не запускается, ругается: сделана в допотопные времена и капризная виста ее понимать не хочет. может сылочку на файлик кинете плиз?

Если Вы грузили программу с официального сайта, там же расположены исходные тексты программы, в которых искомые файлы RTF находятся.

Vista при первом запуске должна была сообщить, где и как получить программу для чтения файлов в формате HLP. Купив программное обеспечение у компании Microsoft, Вы оплатили и его поддержку. Так воспользуйтесь своим правом получить ее от продавца.

Сообщение отредактировал Игорь - 17.12.2011 - 09:33


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Gewissta
сообщение 17.12.2011 - 19:35
Сообщение #24





Группа: Пользователи
Сообщений: 14
Регистрация: 29.10.2011
Из: Екатеринбург
Пользователь №: 23265



Цитата(Игорь @ 17.12.2011 - 10:24) *
Интуитивно (возможно и даже очень вероятно, это показано в литературе) можно предположить, что чем ближе распределение предикторов к нормальному распределению, тем более адекватную модель удастся получить.

Если Вы грузили программу с официального сайта, там же расположены исходные тексты программы, в которых искомые файлы RTF находятся.

Vista при первом запуске должна была сообщить, где и как получить программу для чтения файлов в формате HLP. Купив программное обеспечение у компании Microsoft, Вы оплатили и его поддержку. Так воспользуйтесь своим правом получить ее от продавца.


это официальный сайт - http://www.attestat.valsoft.ru?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 17.12.2011 - 19:51
Сообщение #25





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(Gewissta @ 14.12.2011 - 23:43) *
критично ли для логрегрессии нарушения многомерного нормального распределения (имеется в виду распределение значений предикторов, конечно).

Прелесть логистической регрессии в том и состоит, что предикторы могут быть и бинарные, тогда экспонента коэффициента (для одновариантной регрессии) совпадает с рассчитанной по четырехпольной таблице, а также и категориальными, реализовано в SPSS. А контроль модели - оценка ROC.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 18.12.2011 - 10:45
Сообщение #26





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Gewissta @ 17.12.2011 - 20:35) *
это официальный сайт -

http://attestatsoft.narod.ru


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Gewissta
сообщение 18.12.2011 - 20:22
Сообщение #27





Группа: Пользователи
Сообщений: 14
Регистрация: 29.10.2011
Из: Екатеринбург
Пользователь №: 23265



Цитата(DrgLena @ 17.12.2011 - 20:51) *
Прелесть логистической регрессии в том и состоит, что предикторы могут быть и бинарные, тогда экспонента коэффициента (для одновариантной регрессии) совпадает с рассчитанной по четырехпольной таблице, а также и категориальными, реализовано в SPSS. А контроль модели - оценка ROC.


а вот кривую Колмогорова-Смирнова для оценки риска модели в SPSS не построишь (
может кто знает как syntax к ней написать

Сообщение отредактировал Gewissta - 18.12.2011 - 20:27
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 18.12.2011 - 20:59
Сообщение #28





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Gewissta @ 18.12.2011 - 20:22) *
а вот кривую Колмогорова-Смирнова для оценки риска модели в SPSS не построишь (
может кто знает как syntax к ней написать


Прошу вашего великодушного пардону, а что это за зверь такой - кривая Колмогорова-Смирнова? Просветите, когда не лень. Не дайте помереть полным болваном smile.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Gewissta
сообщение 18.12.2011 - 21:16
Сообщение #29





Группа: Пользователи
Сообщений: 14
Регистрация: 29.10.2011
Из: Екатеринбург
Пользователь №: 23265



Цитата(100$ @ 18.12.2011 - 21:59) *
Прошу вашего великодушного пардону, а что это за зверь такой - кривая Колмогорова-Смирнова? Просветите, когда не лень. Не дайте помереть полным болваном smile.gif


Статистика КС
вычисляется просто: это максимум разности между кумулятивным процентом распределения "хороших" заемщиков
и кумулятивным процентом распределения "плохих" заемщиков (тут зависит от категорий зависимой переменной). Теоретически статистика КС может принимать
значения от 0 до 100, однако на практике она обычно оказывается в диапазоне от 25 до 75.
Примерная градация выглядит так:
меньше 20 - наверное, скоринговая таблица непригодна к применению;
20-40 - неплохая таблица;
41-50 - хорошая таблица;
51-60 - очень хорошая таблица;
61-75 - поразительно хорошая таблица;
больше 75 - вероятно, слишком хороший результат, чтобы быть правдой, наверное, что-то
неправильно

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 18.12.2011 - 21:40
Сообщение #30





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Gewissta @ 18.12.2011 - 21:16) *
Статистика КС
вычисляется просто: это максимум разности между кумулятивным процентом распределения "хороших" заемщиков
и кумулятивным процентом распределения "плохих" заемщиков (тут зависит от категорий зависимой переменной). Теоретически статистика КС может принимать
значения от 0 до 100, однако на практике она обычно оказывается в диапазоне от 25 до 75.
Примерная градация выглядит так:
меньше 20 - наверное, скоринговая таблица непригодна к применению;
20-40 - неплохая таблица;
41-50 - хорошая таблица;
51-60 - очень хорошая таблица;
61-75 - поразительно хорошая таблица;
больше 75 - вероятно, слишком хороший результат, чтобы быть правдой, наверное, что-то
неправильно


Вас понял: кривой Колмогорова-Смирнова в природе не существует. А говорить надо: "статистика типа Колмогорова - Смирнова", поскольку эти два ученых никогда не печатались вместе, не продолжали исследования друг друга, и не изучали один и тот же критерий ни вместе, ни порознь.
Успехов в изучении матчасти!

Сообщение отредактировал 100$ - 18.12.2011 - 21:42
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

5 страниц V  < 1 2 3 4 > » 
Добавить ответ в эту темуОткрыть тему