Здравствуйте, гость ( Вход | Регистрация )
2.01.2020 - 08:23
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 30.04.2018 Пользователь №: 31313 |
Доброго времени суток!
https://towardsdatascience.com/simply-expla...-r-b919acb1d6b3 |
|
|
![]() |
![]() |
![]() |
12.09.2022 - 01:47
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
А зачем такие страсти-мордасти?
Выберу и тип окна, и его настройки так, чтобы получить пересглаженную оценку - это ж не приговор. Лишь бы на ней глобальный пик читался. P.S. А для оценки логистической регрессии в R дихотомическая переменная - это просто столбец 1 и 0, или ее надо перекодировать в факторную переменную? Попробовал и так, и сяк, оценки коэффициентов близкие, но как правильно - пока не знаю. P.P.S. Насчет картинки. Прямо "Черный квадрат" какой-то. Хотя автор, вроде бы, не Малевич. Это какие-то частные кривульки: одна соответствует нулям дихотомического фактора, а другая - единицам? И в чем ее познавательная ценность? Сообщение отредактировал 100$ - 12.09.2022 - 13:35 |
|
|
![]() |
![]() |
12.09.2022 - 19:35
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 290 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 |
А зачем такие страсти-мордасти? Выберу и тип окна, и его настройки так, чтобы получить пересглаженную оценку - это ж не приговор. Лишь бы на ней глобальный пик читался. Эдак, выбрав неправильные настройки, можно пересгладить до равномерного распределения. Причем то, какие настройки правильные, - большой вопрос. Методов поиска оптимальной ширины окна тьма тьмущая, и результаты они дают сильно разные. Например, не помню уже какой именно, основанный на кросссвалидации (а только таких существует не менее трех, не говоря уж о прочих), а может, и все они, работает неправильно при наличии малейших признаков группировки наблюдений (например, той которая возникает, если цена деления шкалы прибора не исчезающе мала на фоне размаха измеряемой величины). И так у каждого свои слабые места. Поэтому на тему очередного "самого правильного метода" постоянно выходят все новые статьи. Но, как показывает практика, каждый из них хорошо работает лишь в частных случаях. А ведь еще есть адаптивные ядра, которые не то чтобы можно, а просто нужно использовать при малых n., чтобы не получить ложных пиков. А там еще один параметр добавляется. В итоге наша регрессионная модель приходит в непредсказуемую зависимость от кучи дополнительных параметров. Это явно метод для тех, чье жизненное кредо "не созданы мы для легких путей" Цитата P.S. А для оценки логистической регрессии в R дихотомическая переменная - это просто столбец 1 и 0, или ее надо перекодировать в факторную переменную? Попробовал и так, и сяк, оценки коэффициентов близкие, но как правильно - пока не знаю. Тайна сия велика есть! В документации описаны два способа, которые по идее должны быть эквивалентны, но в реальности это почему-то не так Цитата P.P.S. Насчет картинки. Прямо "Черный квадрат" какой-то. Хотя автор, вроде бы, не Малевич. Почему черный? Он же белый! Но суть Вы уловили верно. Только там еще учтено взаимодейстивие двух факторов, без него кривые были бы параллельны, но тоже две. А как эти две частные кривульки можно обобщить до одной глобальной? Не представляю. Суть диагараммы проста: влияние непрерывного предиктора на зависимую переменную различается в зависимости от другого дихотомичесокого предиктора (принадлежности к одной из двух групп). Можно, например, представить, что красным изображены девочки, а синим - мальчики, по оси абсцисс отложена доза препарата, а по оси ординат - уровень в крови фактора Ы (хотя на самом деле это вовсе не так, но сути представления не меняет).Это какие-то частные кривульки: одна соответствует нулям дихотомического фактора, а другая - единицам? И в чем ее познавательная ценность? |
|
|
![]() |
![]() |
12.09.2022 - 23:04
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
А ведь еще есть адаптивные ядра, которые не то чтобы можно, а просто нужно использовать при малых n., чтобы не получить ложных пиков. Ну, вообще-то базовая проблема ядерного сглаживания - не ложные пики, а краевые эффекты, но речь не о том. Речь о том, что я хочу хоть в первом приближении уловить точку, в окрестности которой можно поискать некий оптимум. Патамушта в общем случае вожделенный поиск удачной точки дихотомизации (особливо в присутствии "переключателя" - дихотомической переменной) - это поиск того, чего нет. Цитата Эдак, выбрав неправильные настройки, можно пересгладить до равномерного распределения. А вы часто видели в медицине равномерные распределения? Я - нет. Поэтому, завидев равномерное распределение, тотчас отыграю назад ). Цитата Например, существует расчудесный пакет {np} c огромным арсеналом методов ядерной непараметрической и полупараметрической регрессии. Но, увы мне не удалось построить с его помощью ни одной б. м. адекватной модели. Небольшое изменение настроек, например, смена метода определения ширины окна приводило просто к чудовищным переменам регрессионных кривых с моими данными. Так и забросил его, немного поигравшись. Если победите зверя этого, дайте знать. Кстати, количество аргумернтов в функциях там максимальное из того, что я встречал в пакетах R (как бы не под сотню) - это к вопросу о простоте ядерных методов. Ничего себе "небольшое изменение". От него-то по большей части все и зависит. И потом, а чего вы, собственно, хотите? Задача восстановления плотности (в т.ч. и условной) относится к классу некорректных задач. Поэтому единственно правильного учения там нет и быть не может. Любая непараметрическая регрессия - это формализация понятия "сглаживание на глазок". Наверное, в статистике для самого расчудесного метода можно подобрать датасет, который ему (методу) не по зубам. На одном датасете у меня, н-р, нейросеть просто колом встала. Ну и что? Бывает. Цитата Если победите зверя этого, дайте знать. Я в свое время отдал дань пакету {kedd}, а теперь даже не вижу его в перечне пакетов, доступных для загрузки. Все эти пакеты имеют свойство быстро надоедать. Примерно как листание всех этих бесконечных pdf'ов. Однако, в перечне соавторов {np} заявлен Джеффри Расин, а это, можно сказать, мой любимый писатель на тему непараметрической регрессии. Цитата Тайна сия велика есть! В документации описаны два способа, которые по идее должны быть эквивалентны, но в реальности это почему-то не так ... Поскольку почтив во всех виденных мною публикациях с примерами дихотомическая переменная задается как фактор в таблице "длинного формата", всегда так и делаю. Спасибо за экспресс-консультацию. Теперь буду делать так же. Сообщение отредактировал 100$ - 12.09.2022 - 23:05 |
|
|
![]() |
![]() |
Felix77 Логистическая регрессия, помогите понять 2.01.2020 - 08:23
nokh Цитата(Felix77 @ 2.01.2020 - 10:23) ... 2.01.2020 - 19:54
Игорь Цитата(nokh @ 2.01.2020 - 20:54) У а... 8.01.2020 - 16:59
100$ Цитата(Игорь @ 8.01.2020 - 16:59) Не... 8.01.2020 - 17:14
Игорь Цитата(100$ @ 8.01.2020 - 18:14... 8.01.2020 - 20:06
100$ Цитата(Игорь @ 8.01.2020 - 20:06) Ка... 8.01.2020 - 22:29
Игорь Цитата(100$ @ 8.01.2020 - 23:29... 10.01.2020 - 08:20
nokh Цитата(Игорь @ 10.01.2020 - 10:20) .... 10.01.2020 - 09:56
100$ Цитата(Игорь @ 10.01.2020 - 08:20) П... 10.01.2020 - 13:53
Felix77 Спасибо! 3.01.2020 - 07:59
salm А подскажите, при введении в модель логистической ... 16.03.2022 - 21:37
nokh Цитата(salm @ 16.03.2022 - 23:37) А ... 21.03.2022 - 22:33
Anna_V Цитата(nokh @ 21.03.2022 - 22:33) Пр... 22.03.2022 - 07:02

nokh Цитата(Anna_V @ 22.03.2022 - 09:02) ... 23.03.2022 - 13:41
salm Цитата(nokh @ 21.03.2022 - 22:33) По... 30.03.2022 - 18:57
salm А скажите, корректно ли будет один количсетвенный ... 30.03.2022 - 09:01
nzbr Цитата(salm @ 30.03.2022 - 09:01) А ... 6.06.2022 - 07:50
salm Не подскажете: как диссертации грамотнообьяснить с... 6.04.2022 - 23:54
passant Цитата(salm @ 6.04.2022 - 23:54) Не ... 7.04.2022 - 10:37

salm Цитата(passant @ 7.04.2022 - 10:37) ... 7.04.2022 - 11:59
DoctorStat Цитата(salm @ 6.04.2022 - 23:54) Не ... 14.04.2022 - 09:47

salm Цитата(DoctorStat @ 14.04.2022 - 09... 10.05.2022 - 17:45
nzbr Цитата(salm @ 6.04.2022 - 23:54) Не ... 13.05.2022 - 15:25
salm Цитата(nzbr @ 13.05.2022 - 15:25) Я ... 16.05.2022 - 22:05
salm Доброго времени суток. Подскажите пожалуйста, могу... 10.05.2022 - 17:05
Игорь Цитата(salm @ 10.05.2022 - 18:05) в ... 11.05.2022 - 11:37
salm Цитата(Игорь @ 11.05.2022 - 11:37) Н... 16.05.2022 - 22:01
salm и еще: мне понять смысл AUC при построении прогно... 25.05.2022 - 09:53
ИНО Цитата(salm @ 25.05.2022 - 09:53) и ... 6.06.2022 - 11:25
salm Здравствуйте еще раз!!! А я могу испол... 30.06.2022 - 22:55
passant Цитата(salm @ 30.06.2022 - 22:55) Зд... 30.06.2022 - 23:54
salm Цитата(passant @ 30.06.2022 - 23:54)... 1.07.2022 - 09:27
ИНО А вот я категорически против. Когда факторов много... 1.07.2022 - 05:40
salm Цитата(ИНО @ 1.07.2022 - 05:40) А во... 1.07.2022 - 09:55
100$ Цитата(salm @ 1.07.2022 - 09:55) ...... 1.07.2022 - 17:45
ИНО Под "мусором" я подразумевал предикторы,... 1.07.2022 - 23:01
salm Цитата(ИНО @ 1.07.2022 - 23:01) Под ... 2.07.2022 - 15:47
salm А не подскажете ли как вычисляется в процентах, на... 2.07.2022 - 15:57
salm Цитата(salm @ 2.07.2022 - 15:57) А н... 3.07.2022 - 00:59
salm Я может, сейчас лишнее напишу)) но Вы, пожалуйста,... 2.07.2022 - 16:27
ИНО Цитатану доказать что старый-добрый не влияет -это... 2.07.2022 - 19:30
salm Цитата(ИНО @ 2.07.2022 - 19:30) Наск... 6.07.2022 - 09:06
ИНО ЦитатаЯ же аспирант, моя задача- это разобраться к... 2.07.2022 - 19:58
ИНО То, что Вы просите называется, "декомпозиция ... 3.07.2022 - 02:18
salm Цитата(ИНО @ 3.07.2022 - 02:18) То, ... 6.07.2022 - 08:53
salm Здравставуйте.
Скажите пожалуйста, вот у меня ест... 12.08.2022 - 12:05
100$ ЦитатаМой вопрос - как мне сравнить AUC?
Идейно т... 12.08.2022 - 13:03
salm Цитата(100$ @ 12.08.2022 - 13:0... 13.08.2022 - 11:18
100$ Цитата(salm @ 13.08.2022 - 11:18) Ща... 13.08.2022 - 17:12
ИНО Цитата(salm @ 13.08.2022 - 11:18) Оо... 14.08.2022 - 01:40
ИНО Если мне не изменяет память roc.test() использует ... 13.08.2022 - 04:02
100$ Цитата(ИНО @ 13.08.2022 - 04:02) Есл... 13.08.2022 - 17:06
ИНО Цитата(100$ @ 13.08.2022 - 17:0... 14.08.2022 - 01:31
100$ Цитата(ИНО @ 14.08.2022 - 01:31) До ... 14.08.2022 - 19:41
ИНО Сцай-хаб, Либген и Гугль-академия - три кита совре... 14.08.2022 - 22:18
100$ Цитата(ИНО @ 14.08.2022 - 22:18) А м... 14.08.2022 - 23:53
salm Здраааааствуйте!!!
Я тупая, но упрямая... 14.08.2022 - 19:07
100$ Цитата(salm @ 14.08.2022 - 19:07) Зд... 14.08.2022 - 19:28
salm Цитата(100$ @ 14.08.2022 - 19:2... 15.08.2022 - 09:41
ИНО Просмотрел статью по Вашей ссылке. Авторы явно заб... 15.08.2022 - 08:04
100$ Цитата(ИНО @ 15.08.2022 - 08:04) В п... 15.08.2022 - 13:40
salm А подскажите пожалуйста))
Вот мне нужен простой а... 15.08.2022 - 10:24
100$ Цитата(salm @ 15.08.2022 - 10:24) Ме... 17.08.2022 - 20:20
ИНО Для начала почему у первых двух, этих-самых ... 16.08.2022 - 12:24
100$ Цитата(ИНО @ 16.08.2022 - 12:24) Для... 16.08.2022 - 15:16
ИНО salm, а Вы уверены, что нужна единая точка отсечки... 16.08.2022 - 16:44
100$ Цитата(ИНО @ 16.08.2022 - 16:44) Кст... 16.08.2022 - 21:29
ИНО Скажу больше: сегодня - не мой год, и такой уже 9-... 16.08.2022 - 22:55
100$ Цитата(ИНО @ 16.08.2022 - 22:55) Вы,... 17.08.2022 - 00:31
ИНО Видимо, у каждого свои ассоциации со словом ... 17.08.2022 - 05:54
100$ Цитата(ИНО @ 17.08.2022 - 05:54) Еще... 17.08.2022 - 12:12
ИНО Цитата(100$ @ 17.08.2022 - 12:1... 17.08.2022 - 17:08
100$ Цитата(ИНО @ 17.08.2022 - 17:08) Уме... 17.08.2022 - 20:17
ИНО Цитата(100$ @ 17.08.2022 - 20:1... 17.08.2022 - 20:41
100$ Цитата(ИНО @ 17.08.2022 - 20:41) Я н... 17.08.2022 - 20:56
passant salm "У меня программа строит график зависимо... 17.08.2022 - 16:37
salm Добрый лень. Спасибо, что отвечаете
У меня есть од... 9.09.2022 - 18:48
100$ Цитата(salm @ 9.09.2022 - 18:48) Воз... 10.09.2022 - 00:07
ИНО Ну очень просто, да Кстати, так и не увидел, как... 11.09.2022 - 10:33
100$ Цитата(ИНО @ 11.09.2022 - 10:33) Кст... 11.09.2022 - 14:10
ИНО Зачем же сразу острить про Спортлото? Не раз уже п... 18.08.2022 - 06:14
ИНО Лень добрым не бывает!
А с чего Вы взяли, что... 9.09.2022 - 21:40
salm Цитата(ИНО @ 9.09.2022 - 21:40) Лень... 9.09.2022 - 22:35
ИНО Опять Вы в какие-то дебри ноу-хау лезете. Диаграмм... 11.09.2022 - 17:16
100$ Я рассуждаю просто: вся информация о совместном ра... 11.09.2022 - 18:14
ИНО Ядерная оценка плотности - это не хухры-мухры... 12.09.2022 - 00:26
ИНО Цитата(100$ @ 12.09.2022 - 23:0... 13.09.2022 - 01:42
Leonov При использовании многомерного метода статистическ... 22.09.2022 - 16:41
Игорь Как надо делать: Hosmer D.W., Lemeshow S. Applied ... 24.09.2022 - 09:11
100$ Цитата(Игорь @ 24.09.2022 - 09:11) К... 25.09.2022 - 18:46![]() ![]() |