Здравствуйте, гость ( Вход | Регистрация )
2.01.2020 - 08:23
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 30.04.2018 Пользователь №: 31313 |
Доброго времени суток!
https://towardsdatascience.com/simply-expla...-r-b919acb1d6b3 |
|
|
![]() |
![]() |
![]() |
16.08.2022 - 16:44
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 290 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 |
salm, а Вы уверены, что нужна единая точка отсечки для метода 2 при разных уровнях фактора метода 1? Думается, что куда полезнее и проще было бы иметь разные точки отсечки в зависимости от того, есть ли у пациента это-самое, что определяет метод 1 или же нет. Решается двумя отдельными ROC-анализами (первый для тех, у кого есть, второй - для тех, у кого нет), можно вообще без моделей.
По той же самой причине, почему там 2 socio-demo и 4 order'а: это какие-то известные только им градации/категории чего-то там (см. раrt 3). Перечитал с гуглопереводом. Все равно не понял, почему предикторы имеют дублирующие названия. Видимо, без доступа к этому набору данных тайна сия будет покрыта мраком вечно. Далее, не могу понять, почему для RF большинство строк пустуют? Как RF вообще может ни разу не выбрать какой-либо предиктор? Сколько раз использовал - не было такого. Насколько я помню, классический лес Брэймана сотсоит из необрезанных деревьев CART, поэтому даже мусорные предикторы обязаны иметь импортансы, пусть и маленькие. Кстати, не нашел упоминаний о том, как их рассчитывали, а ведь методы есть разные. При этом импортансы из классического RF хоть на основе индекса Джинни, хоть перестановочные, нельзя использовать напрямую для составления сквозного рейтинга в случаях разнородных данных (например, если в одной модели есть непрерывные величины и категориальные с разным количеством уровней). Без учета этих нюансов последняя таблица имеет мало смысла. Единственное, что мне ясно из нее: принципиально разные модели по-разному выбирают наиболее значимые предикторы и это было ожидаемо. Например, если связь зависимой переменной с предиктором сильна, но не монотонна, то любая обобщенна линейная модель (и ансамбль оных) ее не заметит, для RF же тут никакой проблемы нет. Но он может быть не столь хорош для обычной линейной связи. Если разнородные предикторы скоррелированы между собой, то при включении в такой вот "топ-10" между ними идет жесткая борьба и конечный выбор может в большей степени быть зависим от "любви" конкретного метода моделирования к конкретной форме зависимостей, нежели от реальной значимости предикторов. К сожалению из этой статьи нельзя сказать какая модель дала рейтинг более близкий к истине, т. к. эта истина неизвестна. Узнать ее можно было бы при использовании синтетическго набора данных, но почему-то авторы не сделали этого. В общем ИМХО, предлагаемые методы, может, и хороши, но статья - все равно говно. Сообщение отредактировал ИНО - 16.08.2022 - 20:14 |
|
|
![]() |
![]() |
Felix77 Логистическая регрессия, помогите понять 2.01.2020 - 08:23
nokh Цитата(Felix77 @ 2.01.2020 - 10:23) ... 2.01.2020 - 19:54
Игорь Цитата(nokh @ 2.01.2020 - 20:54) У а... 8.01.2020 - 16:59
100$ Цитата(Игорь @ 8.01.2020 - 16:59) Не... 8.01.2020 - 17:14
Игорь Цитата(100$ @ 8.01.2020 - 18:14... 8.01.2020 - 20:06
100$ Цитата(Игорь @ 8.01.2020 - 20:06) Ка... 8.01.2020 - 22:29
Игорь Цитата(100$ @ 8.01.2020 - 23:29... 10.01.2020 - 08:20
nokh Цитата(Игорь @ 10.01.2020 - 10:20) .... 10.01.2020 - 09:56
100$ Цитата(Игорь @ 10.01.2020 - 08:20) П... 10.01.2020 - 13:53
Felix77 Спасибо! 3.01.2020 - 07:59
salm А подскажите, при введении в модель логистической ... 16.03.2022 - 21:37
nokh Цитата(salm @ 16.03.2022 - 23:37) А ... 21.03.2022 - 22:33
Anna_V Цитата(nokh @ 21.03.2022 - 22:33) Пр... 22.03.2022 - 07:02

nokh Цитата(Anna_V @ 22.03.2022 - 09:02) ... 23.03.2022 - 13:41
salm Цитата(nokh @ 21.03.2022 - 22:33) По... 30.03.2022 - 18:57
salm А скажите, корректно ли будет один количсетвенный ... 30.03.2022 - 09:01
nzbr Цитата(salm @ 30.03.2022 - 09:01) А ... 6.06.2022 - 07:50
salm Не подскажете: как диссертации грамотнообьяснить с... 6.04.2022 - 23:54
passant Цитата(salm @ 6.04.2022 - 23:54) Не ... 7.04.2022 - 10:37

salm Цитата(passant @ 7.04.2022 - 10:37) ... 7.04.2022 - 11:59
DoctorStat Цитата(salm @ 6.04.2022 - 23:54) Не ... 14.04.2022 - 09:47

salm Цитата(DoctorStat @ 14.04.2022 - 09... 10.05.2022 - 17:45
nzbr Цитата(salm @ 6.04.2022 - 23:54) Не ... 13.05.2022 - 15:25
salm Цитата(nzbr @ 13.05.2022 - 15:25) Я ... 16.05.2022 - 22:05
salm Доброго времени суток. Подскажите пожалуйста, могу... 10.05.2022 - 17:05
Игорь Цитата(salm @ 10.05.2022 - 18:05) в ... 11.05.2022 - 11:37
salm Цитата(Игорь @ 11.05.2022 - 11:37) Н... 16.05.2022 - 22:01
salm и еще: мне понять смысл AUC при построении прогно... 25.05.2022 - 09:53
ИНО Цитата(salm @ 25.05.2022 - 09:53) и ... 6.06.2022 - 11:25
salm Здравствуйте еще раз!!! А я могу испол... 30.06.2022 - 22:55
passant Цитата(salm @ 30.06.2022 - 22:55) Зд... 30.06.2022 - 23:54
salm Цитата(passant @ 30.06.2022 - 23:54)... 1.07.2022 - 09:27
ИНО А вот я категорически против. Когда факторов много... 1.07.2022 - 05:40
salm Цитата(ИНО @ 1.07.2022 - 05:40) А во... 1.07.2022 - 09:55
100$ Цитата(salm @ 1.07.2022 - 09:55) ...... 1.07.2022 - 17:45
ИНО Под "мусором" я подразумевал предикторы,... 1.07.2022 - 23:01
salm Цитата(ИНО @ 1.07.2022 - 23:01) Под ... 2.07.2022 - 15:47
salm А не подскажете ли как вычисляется в процентах, на... 2.07.2022 - 15:57
salm Цитата(salm @ 2.07.2022 - 15:57) А н... 3.07.2022 - 00:59
salm Я может, сейчас лишнее напишу)) но Вы, пожалуйста,... 2.07.2022 - 16:27
ИНО Цитатану доказать что старый-добрый не влияет -это... 2.07.2022 - 19:30
salm Цитата(ИНО @ 2.07.2022 - 19:30) Наск... 6.07.2022 - 09:06
ИНО ЦитатаЯ же аспирант, моя задача- это разобраться к... 2.07.2022 - 19:58
ИНО То, что Вы просите называется, "декомпозиция ... 3.07.2022 - 02:18
salm Цитата(ИНО @ 3.07.2022 - 02:18) То, ... 6.07.2022 - 08:53
salm Здравставуйте.
Скажите пожалуйста, вот у меня ест... 12.08.2022 - 12:05
100$ ЦитатаМой вопрос - как мне сравнить AUC?
Идейно т... 12.08.2022 - 13:03
salm Цитата(100$ @ 12.08.2022 - 13:0... 13.08.2022 - 11:18
100$ Цитата(salm @ 13.08.2022 - 11:18) Ща... 13.08.2022 - 17:12
ИНО Цитата(salm @ 13.08.2022 - 11:18) Оо... 14.08.2022 - 01:40
ИНО Если мне не изменяет память roc.test() использует ... 13.08.2022 - 04:02
100$ Цитата(ИНО @ 13.08.2022 - 04:02) Есл... 13.08.2022 - 17:06
ИНО Цитата(100$ @ 13.08.2022 - 17:0... 14.08.2022 - 01:31
100$ Цитата(ИНО @ 14.08.2022 - 01:31) До ... 14.08.2022 - 19:41
ИНО Сцай-хаб, Либген и Гугль-академия - три кита совре... 14.08.2022 - 22:18
100$ Цитата(ИНО @ 14.08.2022 - 22:18) А м... 14.08.2022 - 23:53
salm Здраааааствуйте!!!
Я тупая, но упрямая... 14.08.2022 - 19:07
100$ Цитата(salm @ 14.08.2022 - 19:07) Зд... 14.08.2022 - 19:28
salm Цитата(100$ @ 14.08.2022 - 19:2... 15.08.2022 - 09:41
ИНО Просмотрел статью по Вашей ссылке. Авторы явно заб... 15.08.2022 - 08:04
100$ Цитата(ИНО @ 15.08.2022 - 08:04) В п... 15.08.2022 - 13:40
salm А подскажите пожалуйста))
Вот мне нужен простой а... 15.08.2022 - 10:24
100$ Цитата(salm @ 15.08.2022 - 10:24) Ме... 17.08.2022 - 20:20
ИНО Для начала почему у первых двух, этих-самых ... 16.08.2022 - 12:24
100$ Цитата(ИНО @ 16.08.2022 - 12:24) Для... 16.08.2022 - 15:16
100$ Цитата(ИНО @ 16.08.2022 - 16:44) Кст... 16.08.2022 - 21:29
ИНО Скажу больше: сегодня - не мой год, и такой уже 9-... 16.08.2022 - 22:55
100$ Цитата(ИНО @ 16.08.2022 - 22:55) Вы,... 17.08.2022 - 00:31
ИНО Видимо, у каждого свои ассоциации со словом ... 17.08.2022 - 05:54
100$ Цитата(ИНО @ 17.08.2022 - 05:54) Еще... 17.08.2022 - 12:12
ИНО Цитата(100$ @ 17.08.2022 - 12:1... 17.08.2022 - 17:08
100$ Цитата(ИНО @ 17.08.2022 - 17:08) Уме... 17.08.2022 - 20:17
ИНО Цитата(100$ @ 17.08.2022 - 20:1... 17.08.2022 - 20:41
100$ Цитата(ИНО @ 17.08.2022 - 20:41) Я н... 17.08.2022 - 20:56
passant salm "У меня программа строит график зависимо... 17.08.2022 - 16:37
salm Добрый лень. Спасибо, что отвечаете
У меня есть од... 9.09.2022 - 18:48
100$ Цитата(salm @ 9.09.2022 - 18:48) Воз... 10.09.2022 - 00:07
ИНО Ну очень просто, да Кстати, так и не увидел, как... 11.09.2022 - 10:33
100$ Цитата(ИНО @ 11.09.2022 - 10:33) Кст... 11.09.2022 - 14:10
ИНО Зачем же сразу острить про Спортлото? Не раз уже п... 18.08.2022 - 06:14
ИНО Лень добрым не бывает!
А с чего Вы взяли, что... 9.09.2022 - 21:40
salm Цитата(ИНО @ 9.09.2022 - 21:40) Лень... 9.09.2022 - 22:35
ИНО Опять Вы в какие-то дебри ноу-хау лезете. Диаграмм... 11.09.2022 - 17:16
100$ Я рассуждаю просто: вся информация о совместном ра... 11.09.2022 - 18:14
ИНО Ядерная оценка плотности - это не хухры-мухры... 12.09.2022 - 00:26
100$ А зачем такие страсти-мордасти?
Выберу и тип окна,... 12.09.2022 - 01:47
ИНО Цитата(100$ @ 12.09.2022 - 01:4... 12.09.2022 - 19:35
100$ Цитата(ИНО @ 12.09.2022 - 19:35) А в... 12.09.2022 - 23:04
ИНО Цитата(100$ @ 12.09.2022 - 23:0... 13.09.2022 - 01:42
Leonov При использовании многомерного метода статистическ... 22.09.2022 - 16:41
Игорь Как надо делать: Hosmer D.W., Lemeshow S. Applied ... 24.09.2022 - 09:11
100$ Цитата(Игорь @ 24.09.2022 - 09:11) К... 25.09.2022 - 18:46![]() ![]() |