Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Логистическая регрессия, помогите понять
Felix77
сообщение 2.01.2020 - 08:23
Сообщение #1





Группа: Пользователи
Сообщений: 10
Регистрация: 30.04.2018
Пользователь №: 31313



Доброго времени суток!
help.gif понять в примере по логистической регрессии в R, как получается коэффициент вероятности 0.854 при GRE-790, GPA-3.8, rank-1. Я так понимаю это можно сделать из коэф. 'estimate'

https://towardsdatascience.com/simply-expla...-r-b919acb1d6b3
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 2.01.2020 - 19:54
Сообщение #2





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Felix77 @ 2.01.2020 - 10:23) *
Доброго времени суток!
help.gif понять в примере по логистической регрессии в R, как получается коэффициент вероятности 0.854 при GRE-790, GPA-3.8, rank-1. Я так понимаю это можно сделать из коэф. 'estimate'

https://towardsdatascience.com/simply-expla...-r-b919acb1d6b3

У автора цитируемого блога в расчётах есть ошибка.
Спорно. Категориальные факторы однозначно следует вводить для номинальных предикторов, но не порядковых. Тогда все эти as.factor не нужны. Хотя так делают, если есть основания считать, что ранги не могут быть интерпретированы в линейной шкале. Покажу на имеющемся этом примере.

Логит=Свободный член + Фактор1*Коэффициент1 + Фактор2*Коэффициент2 + ...
Логит=-3,989979+790*0,002264+3,8*0,804038=0,8539254
Именно это значение выдаётся в качестве прогноза по predict(logit,x)=0.85426 (это без ошибок округления при моём ручном расчёте выше).

Ошибка. Но это не Р, а именно Логит при значениях факторов (gre=790,gpa=3.8,rank=as.factor(1)) для подогнанной модели
Р=1/(1+е^(-Логит)), где е - основание натурального логарифма. Соответственно конец нужно исправить на:

> predicted.logit<-predict(logit,x)
> predicted.logit
1
0.85426
> p=1/(1+exp(-predicted.logit))
> p
1
0.70146

Соответственно, вероятность Р=0,70146
(а если не рассматривать порядковые данные как номинальные, то P=0,6803324)

Сообщение отредактировал nokh - 2.01.2020 - 20:34
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 8.01.2020 - 16:59
Сообщение #3





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(nokh @ 2.01.2020 - 20:54) *
У автора цитируемого блога в расчётах есть ошибка.
Спорно. Категориальные факторы однозначно следует вводить для номинальных предикторов, но не порядковых. Тогда все эти as.factor не нужны. Хотя так делают, если есть основания считать, что ранги не могут быть интерпретированы в линейной шкале. Покажу на имеющемся этом примере.

Логит=Свободный член + Фактор1*Коэффициент1 + Фактор2*Коэффициент2 + ...
Логит=-3,989979+790*0,002264+3,8*0,804038=0,8539254
Именно это значение выдаётся в качестве прогноза по predict(logit,x)=0.85426 (это без ошибок округления при моём ручном расчёте выше).

Ошибка. Но это не Р, а именно Логит при значениях факторов (gre=790,gpa=3.8,rank=as.factor(1)) для подогнанной модели
Р=1/(1+е^(-Логит)), где е - основание натурального логарифма. Соответственно конец нужно исправить на:


Не могу согласиться с данным во втором и третьем абзацах определением логита.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 8.01.2020 - 17:14
Сообщение #4





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Игорь @ 8.01.2020 - 16:59) *
Не могу согласиться с данным во втором и третьем абзацах определением логита.


Ибо истинный Логит - это логарифм отношения вероятности наступления события к вероятности того, что оно не произойдет.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 8.01.2020 - 20:06
Сообщение #5





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(100$ @ 8.01.2020 - 18:14) *
Ибо истинный Логит - это логарифм отношения вероятности наступления события к вероятности того, что оно не произойдет.

Какое отношение данное замечание имеет к обсуждаемой в теме логистической регрессии? Достаточно взять любой источник и убедиться, что выражение, называемое коллегой логитом, является множественной линейной регрессией.

Сообщение отредактировал Игорь - 8.01.2020 - 20:07


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 8.01.2020 - 22:29
Сообщение #6





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Игорь @ 8.01.2020 - 20:06) *
Какое отношение данное замечание имеет к обсуждаемой в теме логистической регрессии?


Непосредственное.


Цитата
Достаточно взять любой источник и убедиться, что выражение, называемое коллегой логитом, является множественной линейной регрессией.


Которая моделирует Ln(Pi/(1-Pi))

Вы растренировались, Игорь.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 10.01.2020 - 08:20
Сообщение #7





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(100$ @ 8.01.2020 - 23:29) *
Непосредственное.




Которая моделирует Ln(Pi/(1-Pi))

Вы растренировались, Игорь.

Понимаете, если бы это был просто троллинг (которым он и является по факту), на этом можно было закончить обсуждение. В принципе, ничего экстраординарного - так обычно развлекаются весьма подготовленные люди на специализированных форумах, отбивая у новичков желание общаться и сводя ценность опубликованной информации к нулю. Для этого применяют ряд методов, основные из которых - необоснованное расширение темы обсуждения и увод обсуждения от основной темы во второстепенные ветки. Методы обычные для "научной" дискуссии. Но человек написал "помогите понять". А начинается понимание с четкого определения понятий и заканчивая нюансами. Свое мнение я изложил в работе, где логистическая регрессия практически полностью описана на 1 странице, включая ссылки на авторитеные источники, и добавить более нечего.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 10.01.2020 - 13:53
Сообщение #8





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Игорь @ 10.01.2020 - 08:20) *
Понимаете, если бы это был просто троллинг (которым он и является по факту), на этом можно было закончить обсуждение. В принципе, ничего экстраординарного - так обычно развлекаются весьма подготовленные люди на специализированных форумах, отбивая у новичков желание общаться и сводя ценность опубликованной информации к нулю. Для этого применяют ряд методов, основные из которых - необоснованное расширение темы обсуждения и увод обсуждения от основной темы во второстепенные ветки. Методы обычные для "научной" дискуссии. Но человек написал "помогите понять". А начинается понимание с четкого определения понятий и заканчивая нюансами. Свое мнение я изложил в работе, где логистическая регрессия практически полностью описана на 1 странице, включая ссылки на авторитеные источники, и добавить более нечего.


Игорь, дайте, пожалуйста, отдохнуть вашему фонтану.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Felix77   Логистическая регрессия, помогите понять   2.01.2020 - 08:23
- - nokh   Цитата(Felix77 @ 2.01.2020 - 10:23) ...   2.01.2020 - 19:54
|- - Игорь   Цитата(nokh @ 2.01.2020 - 20:54) У а...   8.01.2020 - 16:59
|- - 100$   Цитата(Игорь @ 8.01.2020 - 16:59) Не...   8.01.2020 - 17:14
|- - Игорь   Цитата(100$ @ 8.01.2020 - 18:14...   8.01.2020 - 20:06
|- - 100$   Цитата(Игорь @ 8.01.2020 - 20:06) Ка...   8.01.2020 - 22:29
|- - Игорь   Цитата(100$ @ 8.01.2020 - 23:29...   10.01.2020 - 08:20
|- - nokh   Цитата(Игорь @ 10.01.2020 - 10:20) ....   10.01.2020 - 09:56
|- - 100$   Цитата(Игорь @ 10.01.2020 - 08:20) П...   10.01.2020 - 13:53
- - Felix77   Спасибо!   3.01.2020 - 07:59
- - salm   А подскажите, при введении в модель логистической ...   16.03.2022 - 21:37
|- - nokh   Цитата(salm @ 16.03.2022 - 23:37) А ...   21.03.2022 - 22:33
|- - Anna_V   Цитата(nokh @ 21.03.2022 - 22:33) Пр...   22.03.2022 - 07:02
||- - nokh   Цитата(Anna_V @ 22.03.2022 - 09:02) ...   23.03.2022 - 13:41
|- - salm   Цитата(nokh @ 21.03.2022 - 22:33) По...   30.03.2022 - 18:57
- - salm   А скажите, корректно ли будет один количсетвенный ...   30.03.2022 - 09:01
|- - nzbr   Цитата(salm @ 30.03.2022 - 09:01) А ...   6.06.2022 - 07:50
- - salm   Не подскажете: как диссертации грамотнообьяснить с...   6.04.2022 - 23:54
|- - passant   Цитата(salm @ 6.04.2022 - 23:54) Не ...   7.04.2022 - 10:37
||- - salm   Цитата(passant @ 7.04.2022 - 10:37) ...   7.04.2022 - 11:59
|- - DoctorStat   Цитата(salm @ 6.04.2022 - 23:54) Не ...   14.04.2022 - 09:47
||- - salm   Цитата(DoctorStat @ 14.04.2022 - 09...   10.05.2022 - 17:45
|- - nzbr   Цитата(salm @ 6.04.2022 - 23:54) Не ...   13.05.2022 - 15:25
|- - salm   Цитата(nzbr @ 13.05.2022 - 15:25) Я ...   16.05.2022 - 22:05
- - salm   Доброго времени суток. Подскажите пожалуйста, могу...   10.05.2022 - 17:05
|- - Игорь   Цитата(salm @ 10.05.2022 - 18:05) в ...   11.05.2022 - 11:37
|- - salm   Цитата(Игорь @ 11.05.2022 - 11:37) Н...   16.05.2022 - 22:01
- - salm   и еще: мне понять смысл AUC при построении прогно...   25.05.2022 - 09:53
|- - ИНО   Цитата(salm @ 25.05.2022 - 09:53) и ...   6.06.2022 - 11:25
- - salm   Здравствуйте еще раз!!! А я могу испол...   30.06.2022 - 22:55
|- - passant   Цитата(salm @ 30.06.2022 - 22:55) Зд...   30.06.2022 - 23:54
|- - salm   Цитата(passant @ 30.06.2022 - 23:54)...   1.07.2022 - 09:27
- - ИНО   А вот я категорически против. Когда факторов много...   1.07.2022 - 05:40
|- - salm   Цитата(ИНО @ 1.07.2022 - 05:40) А во...   1.07.2022 - 09:55
|- - 100$   Цитата(salm @ 1.07.2022 - 09:55) ......   1.07.2022 - 17:45
- - ИНО   Под "мусором" я подразумевал предикторы,...   1.07.2022 - 23:01
|- - salm   Цитата(ИНО @ 1.07.2022 - 23:01) Под ...   2.07.2022 - 15:47
- - salm   А не подскажете ли как вычисляется в процентах, на...   2.07.2022 - 15:57
|- - salm   Цитата(salm @ 2.07.2022 - 15:57) А н...   3.07.2022 - 00:59
- - salm   Я может, сейчас лишнее напишу)) но Вы, пожалуйста,...   2.07.2022 - 16:27
- - ИНО   Цитатану доказать что старый-добрый не влияет -это...   2.07.2022 - 19:30
|- - salm   Цитата(ИНО @ 2.07.2022 - 19:30) Наск...   6.07.2022 - 09:06
- - ИНО   ЦитатаЯ же аспирант, моя задача- это разобраться к...   2.07.2022 - 19:58
- - ИНО   То, что Вы просите называется, "декомпозиция ...   3.07.2022 - 02:18
|- - salm   Цитата(ИНО @ 3.07.2022 - 02:18) То, ...   6.07.2022 - 08:53
- - salm   Здравставуйте. Скажите пожалуйста, вот у меня ест...   12.08.2022 - 12:05
- - 100$   ЦитатаМой вопрос - как мне сравнить AUC? Идейно т...   12.08.2022 - 13:03
|- - salm   Цитата(100$ @ 12.08.2022 - 13:0...   13.08.2022 - 11:18
|- - 100$   Цитата(salm @ 13.08.2022 - 11:18) Ща...   13.08.2022 - 17:12
|- - ИНО   Цитата(salm @ 13.08.2022 - 11:18) Оо...   14.08.2022 - 01:40
- - ИНО   Если мне не изменяет память roc.test() использует ...   13.08.2022 - 04:02
|- - 100$   Цитата(ИНО @ 13.08.2022 - 04:02) Есл...   13.08.2022 - 17:06
|- - ИНО   Цитата(100$ @ 13.08.2022 - 17:0...   14.08.2022 - 01:31
|- - 100$   Цитата(ИНО @ 14.08.2022 - 01:31) До ...   14.08.2022 - 19:41
|- - ИНО   Сцай-хаб, Либген и Гугль-академия - три кита совре...   14.08.2022 - 22:18
|- - 100$   Цитата(ИНО @ 14.08.2022 - 22:18) А м...   14.08.2022 - 23:53
- - salm   Здраааааствуйте!!! Я тупая, но упрямая...   14.08.2022 - 19:07
|- - 100$   Цитата(salm @ 14.08.2022 - 19:07) Зд...   14.08.2022 - 19:28
|- - salm   Цитата(100$ @ 14.08.2022 - 19:2...   15.08.2022 - 09:41
- - ИНО   Просмотрел статью по Вашей ссылке. Авторы явно заб...   15.08.2022 - 08:04
|- - 100$   Цитата(ИНО @ 15.08.2022 - 08:04) В п...   15.08.2022 - 13:40
- - salm   А подскажите пожалуйста)) Вот мне нужен простой а...   15.08.2022 - 10:24
|- - 100$   Цитата(salm @ 15.08.2022 - 10:24) Ме...   17.08.2022 - 20:20
- - ИНО   Для начала почему у первых двух, этих-самых ...   16.08.2022 - 12:24
|- - 100$   Цитата(ИНО @ 16.08.2022 - 12:24) Для...   16.08.2022 - 15:16
- - ИНО   salm, а Вы уверены, что нужна единая точка отсечки...   16.08.2022 - 16:44
|- - 100$   Цитата(ИНО @ 16.08.2022 - 16:44) Кст...   16.08.2022 - 21:29
- - ИНО   Скажу больше: сегодня - не мой год, и такой уже 9-...   16.08.2022 - 22:55
|- - 100$   Цитата(ИНО @ 16.08.2022 - 22:55) Вы,...   17.08.2022 - 00:31
- - ИНО   Видимо, у каждого свои ассоциации со словом ...   17.08.2022 - 05:54
|- - 100$   Цитата(ИНО @ 17.08.2022 - 05:54) Еще...   17.08.2022 - 12:12
|- - ИНО   Цитата(100$ @ 17.08.2022 - 12:1...   17.08.2022 - 17:08
|- - 100$   Цитата(ИНО @ 17.08.2022 - 17:08) Уме...   17.08.2022 - 20:17
|- - ИНО   Цитата(100$ @ 17.08.2022 - 20:1...   17.08.2022 - 20:41
|- - 100$   Цитата(ИНО @ 17.08.2022 - 20:41) Я н...   17.08.2022 - 20:56
- - passant   salm "У меня программа строит график зависимо...   17.08.2022 - 16:37
|- - salm   Добрый лень. Спасибо, что отвечаете У меня есть од...   9.09.2022 - 18:48
|- - 100$   Цитата(salm @ 9.09.2022 - 18:48) Воз...   10.09.2022 - 00:07
|- - ИНО   Ну очень просто, да Кстати, так и не увидел, как...   11.09.2022 - 10:33
|- - 100$   Цитата(ИНО @ 11.09.2022 - 10:33) Кст...   11.09.2022 - 14:10
- - ИНО   Зачем же сразу острить про Спортлото? Не раз уже п...   18.08.2022 - 06:14
- - ИНО   Лень добрым не бывает! А с чего Вы взяли, что...   9.09.2022 - 21:40
|- - salm   Цитата(ИНО @ 9.09.2022 - 21:40) Лень...   9.09.2022 - 22:35
- - ИНО   Опять Вы в какие-то дебри ноу-хау лезете. Диаграмм...   11.09.2022 - 17:16
|- - 100$   Я рассуждаю просто: вся информация о совместном ра...   11.09.2022 - 18:14
- - ИНО   Ядерная оценка плотности - это не хухры-мухры...   12.09.2022 - 00:26
- - 100$   А зачем такие страсти-мордасти? Выберу и тип окна,...   12.09.2022 - 01:47
|- - ИНО   Цитата(100$ @ 12.09.2022 - 01:4...   12.09.2022 - 19:35
|- - 100$   Цитата(ИНО @ 12.09.2022 - 19:35) А в...   12.09.2022 - 23:04
|- - ИНО   Цитата(100$ @ 12.09.2022 - 23:0...   13.09.2022 - 01:42
- - Leonov   При использовании многомерного метода статистическ...   22.09.2022 - 16:41
- - Игорь   Как надо делать: Hosmer D.W., Lemeshow S. Applied ...   24.09.2022 - 09:11
- - 100$   Цитата(Игорь @ 24.09.2022 - 09:11) К...   25.09.2022 - 18:46


Добавить ответ в эту темуОткрыть тему