Здравствуйте, гость ( Вход | Регистрация )
7.07.2020 - 16:18
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 2.07.2020 Пользователь №: 39533 |
Добрый день.
Есть очень большая выборка для бинарной классификации. Нужно предсказать 2 класса(0/1) Есть огромная куча предикторов(независимых переменных), все они категориальные, и известно, что выборка содержит в себе несколько сегментов, в которых поведение предсказываемых классов будет существенно отличаться. Количество сегментов неизвестно. Как грамотно найти эти сегменты и поделить выборку для дальнейшего предсказания? Сообщение отредактировал smeilz - 7.07.2020 - 16:19 |
|
|
![]() |
![]() |
![]() |
8.07.2020 - 21:31
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Нет, коллеги. В данном случае - вы ошибаетесь. Это действительно вопрос, который сначала фигурировал на другом форуме и судя до форме его представления и ответах на вопросы -ТС действительно интересуется вопросом, просто еще не столь глубоко в теме, что-бы его корректно задать (ну что поделать, результаты активного маркетинга различных ускоренных курсов и прочего "с нуля до профи за 7 дней"). Но на мой взгляд помочь ТС, дать ему различные вИдения, в конце концов "наставить его на путь истинный" области МL - я считаю, это где-то наш долг. Поэтому и отвечаю по четвертому кругу. Я свое мнение ему уже высказал. Если будет ваша добрая воля и желание ТС - будет даже интересно узнать и ваше мнение на предмет.
А вот что-до " как скоро в этой теме появится один из бесчисленных клонов.... " я ожидал этого "явления" в соседней теме про анализ СOVID-19. Но, видать спугнули :-) Сообщение отредактировал passant - 8.07.2020 - 21:38 |
|
|
![]() |
![]() |
9.07.2020 - 00:17
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
passant,
поскольку Андрей (Огурцов) ничего ошибочного, вроде бы, не сказал, фразу Цитата В данном случае - вы ошибаетесь принимаю исключительно на свой счет и настоящим сообщаю, что я рад буду ошибиться. А словоблудливую ботяру из предыдущей ветки Цитата А вот что-до " как скоро в этой теме появится один из бесчисленных клонов.... " я ожидал этого "явления" в соседней теме про анализ СOVID-19. Но, видать спугнули :-) я же и спугнул. Жаль модераторы потерли... Такой коммент был... А вот по поводу ваших несбывшихся ожиданий имею-таки сказать следующее: в соседней теме про СOVID-19 - там, похоже, вся тема создана таким "явлением". А вы, ребята, судя по всему, тест Тьюринга не проходите: не можете отличить имитацию от нормального "белкового" юзера. И ваша профессиональная разговорчивость взяла-таки верх: начали вежливо да тактично лекцыи читать этому клону. А надо бы по принципу "Еще я всякую х...ню на Вы не называл"(с). Не подумайте, что сквернословлю. Из анекдота, знаете ли, слова выкинуть еще труднее, чем из песни. В этой связи у меня вопрос: форум - фсё? Как скоро эти интернет-боты загадят весь форум до антисанитарного состояния и при единодушном одобрямсе тутошних модеров выживут отсюда своей назойливой рекламой "коллектива, возглавляемого сами-знаете-кем" (где собраны кудесники "многомерных методов получения продуктивных результатов", тех немногих старожилов, которые еще как-то пытаются гальванизировать этого покой... (дальше неразборчиво)? Сообщение отредактировал 100$ - 9.07.2020 - 00:33 |
|
|
![]() |
![]() |
smeilz Как грамотно поделить выборку на несколько сегментов перед предсказанием? 7.07.2020 - 16:18
ogurtsov Кластеризацию нужно сделать, а уж какую - тут мног... 7.07.2020 - 20:07
passant Уважаемый smeilz.
Что-то вы начинаете "путат... 8.07.2020 - 11:30
100$ ЦитатаКроме того, вы так и не пояснили, что означа... 8.07.2020 - 19:41
smeilz Цитата(passant @ 8.07.2020 - 11:30) ... 10.07.2020 - 15:09
ogurtsov Цитата(smeilz @ 10.07.2020 - 15:09) ... 10.07.2020 - 18:23
smeilz Цитата(ogurtsov @ 10.07.2020 - 18:23... 10.07.2020 - 22:23
100$ А мне очень интересно, как скоро в этой теме появ... 8.07.2020 - 18:42
ogurtsov Цитата(100$ @ 8.07.2020 - 18:42... 8.07.2020 - 19:05
passant Цитата(100$ @ 9.07.2020 - 00:17... 9.07.2020 - 10:55
nokh Цитата(smeilz @ 7.07.2020 - 18:18) Д... 9.07.2020 - 21:11
100$ Цитата(nokh @ 9.07.2020 - 21:11) Бол... 9.07.2020 - 21:50

nokh Цитата(100$ @ 9.07.2020 - 23:50... 10.07.2020 - 08:10

100$ Цитата(nokh @ 10.07.2020 - 08:10) Да... 10.07.2020 - 10:48
smeilz Цитата(nokh @ 9.07.2020 - 21:11) Ваш... 10.07.2020 - 15:13
comisora Всем добрый день.
Самая первая/последняя книга по... 10.07.2020 - 15:28
100$ Ну вот, господа кластеризаторы и примкнувшие к ним... 10.07.2020 - 18:32
ogurtsov Цитата(100$ @ 10.07.2020 - 18:3... 10.07.2020 - 19:14

100$ Цитата(ogurtsov @ 10.07.2020 - 19:14... 10.07.2020 - 20:30

smeilz Цитата(ogurtsov @ 10.07.2020 - 19:14... 10.07.2020 - 21:57
smeilz Цитата(100$ @ 10.07.2020 - 18:3... 10.07.2020 - 21:53

100$ Цитата(smeilz @ 10.07.2020 - 21:53) ... 10.07.2020 - 22:56
smeilz Цитата(100$ @ 10.07.2020 - 18:3... 10.07.2020 - 22:42
passant Цитата(smeilz @ 10.07.2020 - 22:42) ... 10.07.2020 - 23:18![]() ![]() |