Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Как грамотно поделить выборку на несколько сегментов перед предсказанием?, Деление выборки по неизвестным критериям
smeilz
сообщение 7.07.2020 - 16:18
Сообщение #1





Группа: Пользователи
Сообщений: 7
Регистрация: 2.07.2020
Пользователь №: 39533



Добрый день.
Есть очень большая выборка для бинарной классификации. Нужно предсказать 2 класса(0/1)
Есть огромная куча предикторов(независимых переменных), все они категориальные, и известно, что выборка содержит в себе несколько сегментов, в которых поведение предсказываемых классов будет существенно отличаться. Количество сегментов неизвестно.
Как грамотно найти эти сегменты и поделить выборку для дальнейшего предсказания?

Сообщение отредактировал smeilz - 7.07.2020 - 16:19
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
passant
сообщение 8.07.2020 - 21:31
Сообщение #2





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Нет, коллеги. В данном случае - вы ошибаетесь. Это действительно вопрос, который сначала фигурировал на другом форуме и судя до форме его представления и ответах на вопросы -ТС действительно интересуется вопросом, просто еще не столь глубоко в теме, что-бы его корректно задать (ну что поделать, результаты активного маркетинга различных ускоренных курсов и прочего "с нуля до профи за 7 дней"). Но на мой взгляд помочь ТС, дать ему различные вИдения, в конце концов "наставить его на путь истинный" области МL - я считаю, это где-то наш долг. Поэтому и отвечаю по четвертому кругу. Я свое мнение ему уже высказал. Если будет ваша добрая воля и желание ТС - будет даже интересно узнать и ваше мнение на предмет.
А вот что-до " как скоро в этой теме появится один из бесчисленных клонов.... " я ожидал этого "явления" в соседней теме про анализ СOVID-19. Но, видать спугнули :-)

Сообщение отредактировал passant - 8.07.2020 - 21:38
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 9.07.2020 - 00:17
Сообщение #3





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



passant,

поскольку Андрей (Огурцов) ничего ошибочного, вроде бы, не сказал, фразу

Цитата
В данном случае - вы ошибаетесь


принимаю исключительно на свой счет и настоящим сообщаю, что я рад буду ошибиться.

А словоблудливую ботяру из предыдущей ветки
Цитата
А вот что-до " как скоро в этой теме появится один из бесчисленных клонов.... " я ожидал этого "явления" в соседней теме про анализ СOVID-19. Но, видать спугнули :-)


я же и спугнул. Жаль модераторы потерли... Такой коммент был...

А вот по поводу ваших несбывшихся ожиданий имею-таки сказать следующее: в соседней теме про СOVID-19 - там, похоже, вся тема создана таким "явлением".

А вы, ребята, судя по всему, тест Тьюринга не проходите: не можете отличить имитацию от нормального "белкового" юзера. И ваша профессиональная разговорчивость взяла-таки верх: начали вежливо да тактично лекцыи читать этому клону.

А надо бы по принципу "Еще я всякую х...ню на Вы не называл"(с). Не подумайте, что сквернословлю. Из анекдота, знаете ли, слова выкинуть еще труднее, чем из песни.

В этой связи у меня вопрос: форум - фсё?

Как скоро эти интернет-боты загадят весь форум до антисанитарного состояния и при единодушном одобрямсе тутошних модеров выживут отсюда своей назойливой рекламой "коллектива, возглавляемого сами-знаете-кем" (где собраны кудесники "многомерных методов получения продуктивных результатов", тех немногих старожилов, которые еще как-то пытаются гальванизировать этого покой... (дальше неразборчиво)?

Сообщение отредактировал 100$ - 9.07.2020 - 00:33
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- smeilz   Как грамотно поделить выборку на несколько сегментов перед предсказанием?   7.07.2020 - 16:18
- - ogurtsov   Кластеризацию нужно сделать, а уж какую - тут мног...   7.07.2020 - 20:07
- - passant   Уважаемый smeilz. Что-то вы начинаете "путат...   8.07.2020 - 11:30
|- - 100$   ЦитатаКроме того, вы так и не пояснили, что означа...   8.07.2020 - 19:41
|- - smeilz   Цитата(passant @ 8.07.2020 - 11:30) ...   10.07.2020 - 15:09
|- - ogurtsov   Цитата(smeilz @ 10.07.2020 - 15:09) ...   10.07.2020 - 18:23
|- - smeilz   Цитата(ogurtsov @ 10.07.2020 - 18:23...   10.07.2020 - 22:23
- - 100$   А мне очень интересно, как скоро в этой теме появ...   8.07.2020 - 18:42
|- - ogurtsov   Цитата(100$ @ 8.07.2020 - 18:42...   8.07.2020 - 19:05
- - passant   Нет, коллеги. В данном случае - вы ошибаетесь. Это...   8.07.2020 - 21:31
|- - 100$   passant, поскольку Андрей (Огурцов) ничего ошибо...   9.07.2020 - 00:17
- - passant   Цитата(100$ @ 9.07.2020 - 00:17...   9.07.2020 - 10:55
- - nokh   Цитата(smeilz @ 7.07.2020 - 18:18) Д...   9.07.2020 - 21:11
|- - 100$   Цитата(nokh @ 9.07.2020 - 21:11) Бол...   9.07.2020 - 21:50
||- - nokh   Цитата(100$ @ 9.07.2020 - 23:50...   10.07.2020 - 08:10
||- - 100$   Цитата(nokh @ 10.07.2020 - 08:10) Да...   10.07.2020 - 10:48
|- - smeilz   Цитата(nokh @ 9.07.2020 - 21:11) Ваш...   10.07.2020 - 15:13
- - comisora   Всем добрый день. Самая первая/последняя книга по...   10.07.2020 - 15:28
- - 100$   Ну вот, господа кластеризаторы и примкнувшие к ним...   10.07.2020 - 18:32
|- - ogurtsov   Цитата(100$ @ 10.07.2020 - 18:3...   10.07.2020 - 19:14
||- - 100$   Цитата(ogurtsov @ 10.07.2020 - 19:14...   10.07.2020 - 20:30
||- - smeilz   Цитата(ogurtsov @ 10.07.2020 - 19:14...   10.07.2020 - 21:57
|- - smeilz   Цитата(100$ @ 10.07.2020 - 18:3...   10.07.2020 - 21:53
||- - 100$   Цитата(smeilz @ 10.07.2020 - 21:53) ...   10.07.2020 - 22:56
|- - smeilz   Цитата(100$ @ 10.07.2020 - 18:3...   10.07.2020 - 22:42
- - passant   Цитата(smeilz @ 10.07.2020 - 22:42) ...   10.07.2020 - 23:18


Добавить ответ в эту темуОткрыть тему