Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Логистическая регрессия, помогите понять
Felix77
сообщение 2.01.2020 - 08:23
Сообщение #1





Группа: Пользователи
Сообщений: 10
Регистрация: 30.04.2018
Пользователь №: 31313



Доброго времени суток!
help.gif понять в примере по логистической регрессии в R, как получается коэффициент вероятности 0.854 при GRE-790, GPA-3.8, rank-1. Я так понимаю это можно сделать из коэф. 'estimate'

https://towardsdatascience.com/simply-expla...-r-b919acb1d6b3
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
ИНО
сообщение 16.08.2022 - 16:44
Сообщение #2





Группа: Пользователи
Сообщений: 290
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



salm, а Вы уверены, что нужна единая точка отсечки для метода 2 при разных уровнях фактора метода 1? Думается, что куда полезнее и проще было бы иметь разные точки отсечки в зависимости от того, есть ли у пациента это-самое, что определяет метод 1 или же нет. Решается двумя отдельными ROC-анализами (первый для тех, у кого есть, второй - для тех, у кого нет), можно вообще без моделей.

Цитата(100$ @ 16.08.2022 - 15:16) *
По той же самой причине, почему там 2 socio-demo и 4 order'а: это какие-то известные только им градации/категории чего-то там (см. раrt 3).

Перечитал с гуглопереводом. Все равно не понял, почему предикторы имеют дублирующие названия. Видимо, без доступа к этому набору данных тайна сия будет покрыта мраком вечно. Далее, не могу понять, почему для RF большинство строк пустуют? Как RF вообще может ни разу не выбрать какой-либо предиктор? Сколько раз использовал - не было такого. Насколько я помню, классический лес Брэймана сотсоит из необрезанных деревьев CART, поэтому даже мусорные предикторы обязаны иметь импортансы, пусть и маленькие. Кстати, не нашел упоминаний о том, как их рассчитывали, а ведь методы есть разные. При этом импортансы из классического RF хоть на основе индекса Джинни, хоть перестановочные, нельзя использовать напрямую для составления сквозного рейтинга в случаях разнородных данных (например, если в одной модели есть непрерывные величины и категориальные с разным количеством уровней). Без учета этих нюансов последняя таблица имеет мало смысла. Единственное, что мне ясно из нее: принципиально разные модели по-разному выбирают наиболее значимые предикторы и это было ожидаемо. Например, если связь зависимой переменной с предиктором сильна, но не монотонна, то любая обобщенна линейная модель (и ансамбль оных) ее не заметит, для RF же тут никакой проблемы нет. Но он может быть не столь хорош для обычной линейной связи. Если разнородные предикторы скоррелированы между собой, то при включении в такой вот "топ-10" между ними идет жесткая борьба и конечный выбор может в большей степени быть зависим от "любви" конкретного метода моделирования к конкретной форме зависимостей, нежели от реальной значимости предикторов. К сожалению из этой статьи нельзя сказать какая модель дала рейтинг более близкий к истине, т. к. эта истина неизвестна. Узнать ее можно было бы при использовании синтетическго набора данных, но почему-то авторы не сделали этого. В общем ИМХО, предлагаемые методы, может, и хороши, но статья - все равно говно.

Сообщение отредактировал ИНО - 16.08.2022 - 20:14
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 16.08.2022 - 21:29
Сообщение #3





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(ИНО @ 16.08.2022 - 16:44) *
Кстати, не нашел упоминаний о том, как их рассчитывали, а ведь методы есть разные.


Похоже, сегодня просто не ваш день. Вот, только для вас:

We utilize the out-of-bag (oob) to assess the feature importances [Breiman].

Table 5 lists the top-10 features for RMNL_10 (best overall model) together with
their z-score calculated on oob data


Хорошо помню, что Борута бракует фичи аккурат на основании z-скоров.

А вообще, давайте на этом поставим красивую жирную точку.
Я продолжаю стоять на том, что дерево - такой же классификатор, как и логистическая регрессия. Поэтому случайный ансамбль, выращенный на основе идей RF тоже можно назвать лесом. Ребята со мной согласны:

Therefore, inspired by RF, we propose Random MNL (RMNL) as a new bagged classifier combining a
forest of R MNLs estimated with m randomly selected features on the r-th bootstrap sample.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Felix77   Логистическая регрессия, помогите понять   2.01.2020 - 08:23
- - nokh   Цитата(Felix77 @ 2.01.2020 - 10:23) ...   2.01.2020 - 19:54
|- - Игорь   Цитата(nokh @ 2.01.2020 - 20:54) У а...   8.01.2020 - 16:59
|- - 100$   Цитата(Игорь @ 8.01.2020 - 16:59) Не...   8.01.2020 - 17:14
|- - Игорь   Цитата(100$ @ 8.01.2020 - 18:14...   8.01.2020 - 20:06
|- - 100$   Цитата(Игорь @ 8.01.2020 - 20:06) Ка...   8.01.2020 - 22:29
|- - Игорь   Цитата(100$ @ 8.01.2020 - 23:29...   10.01.2020 - 08:20
|- - nokh   Цитата(Игорь @ 10.01.2020 - 10:20) ....   10.01.2020 - 09:56
|- - 100$   Цитата(Игорь @ 10.01.2020 - 08:20) П...   10.01.2020 - 13:53
- - Felix77   Спасибо!   3.01.2020 - 07:59
- - salm   А подскажите, при введении в модель логистической ...   16.03.2022 - 21:37
|- - nokh   Цитата(salm @ 16.03.2022 - 23:37) А ...   21.03.2022 - 22:33
|- - Anna_V   Цитата(nokh @ 21.03.2022 - 22:33) Пр...   22.03.2022 - 07:02
||- - nokh   Цитата(Anna_V @ 22.03.2022 - 09:02) ...   23.03.2022 - 13:41
|- - salm   Цитата(nokh @ 21.03.2022 - 22:33) По...   30.03.2022 - 18:57
- - salm   А скажите, корректно ли будет один количсетвенный ...   30.03.2022 - 09:01
|- - nzbr   Цитата(salm @ 30.03.2022 - 09:01) А ...   6.06.2022 - 07:50
- - salm   Не подскажете: как диссертации грамотнообьяснить с...   6.04.2022 - 23:54
|- - passant   Цитата(salm @ 6.04.2022 - 23:54) Не ...   7.04.2022 - 10:37
||- - salm   Цитата(passant @ 7.04.2022 - 10:37) ...   7.04.2022 - 11:59
|- - DoctorStat   Цитата(salm @ 6.04.2022 - 23:54) Не ...   14.04.2022 - 09:47
||- - salm   Цитата(DoctorStat @ 14.04.2022 - 09...   10.05.2022 - 17:45
|- - nzbr   Цитата(salm @ 6.04.2022 - 23:54) Не ...   13.05.2022 - 15:25
|- - salm   Цитата(nzbr @ 13.05.2022 - 15:25) Я ...   16.05.2022 - 22:05
- - salm   Доброго времени суток. Подскажите пожалуйста, могу...   10.05.2022 - 17:05
|- - Игорь   Цитата(salm @ 10.05.2022 - 18:05) в ...   11.05.2022 - 11:37
|- - salm   Цитата(Игорь @ 11.05.2022 - 11:37) Н...   16.05.2022 - 22:01
- - salm   и еще: мне понять смысл AUC при построении прогно...   25.05.2022 - 09:53
|- - ИНО   Цитата(salm @ 25.05.2022 - 09:53) и ...   6.06.2022 - 11:25
- - salm   Здравствуйте еще раз!!! А я могу испол...   30.06.2022 - 22:55
|- - passant   Цитата(salm @ 30.06.2022 - 22:55) Зд...   30.06.2022 - 23:54
|- - salm   Цитата(passant @ 30.06.2022 - 23:54)...   1.07.2022 - 09:27
- - ИНО   А вот я категорически против. Когда факторов много...   1.07.2022 - 05:40
|- - salm   Цитата(ИНО @ 1.07.2022 - 05:40) А во...   1.07.2022 - 09:55
|- - 100$   Цитата(salm @ 1.07.2022 - 09:55) ......   1.07.2022 - 17:45
- - ИНО   Под "мусором" я подразумевал предикторы,...   1.07.2022 - 23:01
|- - salm   Цитата(ИНО @ 1.07.2022 - 23:01) Под ...   2.07.2022 - 15:47
- - salm   А не подскажете ли как вычисляется в процентах, на...   2.07.2022 - 15:57
|- - salm   Цитата(salm @ 2.07.2022 - 15:57) А н...   3.07.2022 - 00:59
- - salm   Я может, сейчас лишнее напишу)) но Вы, пожалуйста,...   2.07.2022 - 16:27
- - ИНО   Цитатану доказать что старый-добрый не влияет -это...   2.07.2022 - 19:30
|- - salm   Цитата(ИНО @ 2.07.2022 - 19:30) Наск...   6.07.2022 - 09:06
- - ИНО   ЦитатаЯ же аспирант, моя задача- это разобраться к...   2.07.2022 - 19:58
- - ИНО   То, что Вы просите называется, "декомпозиция ...   3.07.2022 - 02:18
|- - salm   Цитата(ИНО @ 3.07.2022 - 02:18) То, ...   6.07.2022 - 08:53
- - salm   Здравставуйте. Скажите пожалуйста, вот у меня ест...   12.08.2022 - 12:05
- - 100$   ЦитатаМой вопрос - как мне сравнить AUC? Идейно т...   12.08.2022 - 13:03
|- - salm   Цитата(100$ @ 12.08.2022 - 13:0...   13.08.2022 - 11:18
|- - 100$   Цитата(salm @ 13.08.2022 - 11:18) Ща...   13.08.2022 - 17:12
|- - ИНО   Цитата(salm @ 13.08.2022 - 11:18) Оо...   14.08.2022 - 01:40
- - ИНО   Если мне не изменяет память roc.test() использует ...   13.08.2022 - 04:02
|- - 100$   Цитата(ИНО @ 13.08.2022 - 04:02) Есл...   13.08.2022 - 17:06
|- - ИНО   Цитата(100$ @ 13.08.2022 - 17:0...   14.08.2022 - 01:31
|- - 100$   Цитата(ИНО @ 14.08.2022 - 01:31) До ...   14.08.2022 - 19:41
|- - ИНО   Сцай-хаб, Либген и Гугль-академия - три кита совре...   14.08.2022 - 22:18
|- - 100$   Цитата(ИНО @ 14.08.2022 - 22:18) А м...   14.08.2022 - 23:53
- - salm   Здраааааствуйте!!! Я тупая, но упрямая...   14.08.2022 - 19:07
|- - 100$   Цитата(salm @ 14.08.2022 - 19:07) Зд...   14.08.2022 - 19:28
|- - salm   Цитата(100$ @ 14.08.2022 - 19:2...   15.08.2022 - 09:41
- - ИНО   Просмотрел статью по Вашей ссылке. Авторы явно заб...   15.08.2022 - 08:04
|- - 100$   Цитата(ИНО @ 15.08.2022 - 08:04) В п...   15.08.2022 - 13:40
- - salm   А подскажите пожалуйста)) Вот мне нужен простой а...   15.08.2022 - 10:24
|- - 100$   Цитата(salm @ 15.08.2022 - 10:24) Ме...   17.08.2022 - 20:20
- - ИНО   Для начала почему у первых двух, этих-самых ...   16.08.2022 - 12:24
|- - 100$   Цитата(ИНО @ 16.08.2022 - 12:24) Для...   16.08.2022 - 15:16
- - ИНО   salm, а Вы уверены, что нужна единая точка отсечки...   16.08.2022 - 16:44
|- - 100$   Цитата(ИНО @ 16.08.2022 - 16:44) Кст...   16.08.2022 - 21:29
- - ИНО   Скажу больше: сегодня - не мой год, и такой уже 9-...   16.08.2022 - 22:55
|- - 100$   Цитата(ИНО @ 16.08.2022 - 22:55) Вы,...   17.08.2022 - 00:31
- - ИНО   Видимо, у каждого свои ассоциации со словом ...   17.08.2022 - 05:54
|- - 100$   Цитата(ИНО @ 17.08.2022 - 05:54) Еще...   17.08.2022 - 12:12
|- - ИНО   Цитата(100$ @ 17.08.2022 - 12:1...   17.08.2022 - 17:08
|- - 100$   Цитата(ИНО @ 17.08.2022 - 17:08) Уме...   17.08.2022 - 20:17
|- - ИНО   Цитата(100$ @ 17.08.2022 - 20:1...   17.08.2022 - 20:41
|- - 100$   Цитата(ИНО @ 17.08.2022 - 20:41) Я н...   17.08.2022 - 20:56
- - passant   salm "У меня программа строит график зависимо...   17.08.2022 - 16:37
|- - salm   Добрый лень. Спасибо, что отвечаете У меня есть од...   9.09.2022 - 18:48
|- - 100$   Цитата(salm @ 9.09.2022 - 18:48) Воз...   10.09.2022 - 00:07
|- - ИНО   Ну очень просто, да Кстати, так и не увидел, как...   11.09.2022 - 10:33
|- - 100$   Цитата(ИНО @ 11.09.2022 - 10:33) Кст...   11.09.2022 - 14:10
- - ИНО   Зачем же сразу острить про Спортлото? Не раз уже п...   18.08.2022 - 06:14
- - ИНО   Лень добрым не бывает! А с чего Вы взяли, что...   9.09.2022 - 21:40
|- - salm   Цитата(ИНО @ 9.09.2022 - 21:40) Лень...   9.09.2022 - 22:35
- - ИНО   Опять Вы в какие-то дебри ноу-хау лезете. Диаграмм...   11.09.2022 - 17:16
|- - 100$   Я рассуждаю просто: вся информация о совместном ра...   11.09.2022 - 18:14
- - ИНО   Ядерная оценка плотности - это не хухры-мухры...   12.09.2022 - 00:26
- - 100$   А зачем такие страсти-мордасти? Выберу и тип окна,...   12.09.2022 - 01:47
|- - ИНО   Цитата(100$ @ 12.09.2022 - 01:4...   12.09.2022 - 19:35
|- - 100$   Цитата(ИНО @ 12.09.2022 - 19:35) А в...   12.09.2022 - 23:04
|- - ИНО   Цитата(100$ @ 12.09.2022 - 23:0...   13.09.2022 - 01:42
- - Leonov   При использовании многомерного метода статистическ...   22.09.2022 - 16:41
- - Игорь   Как надо делать: Hosmer D.W., Lemeshow S. Applied ...   24.09.2022 - 09:11
- - 100$   Цитата(Игорь @ 24.09.2022 - 09:11) К...   25.09.2022 - 18:46


Добавить ответ в эту темуОткрыть тему