![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 2.07.2020 Пользователь №: 39533 ![]() |
Добрый день.
Есть очень большая выборка для бинарной классификации. Нужно предсказать 2 класса(0/1) Есть огромная куча предикторов(независимых переменных), все они категориальные, и известно, что выборка содержит в себе несколько сегментов, в которых поведение предсказываемых классов будет существенно отличаться. Количество сегментов неизвестно. Как грамотно найти эти сегменты и поделить выборку для дальнейшего предсказания? Сообщение отредактировал smeilz - 7.07.2020 - 16:19 |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 ![]() |
Уважаемый smeilz.
Что-то вы начинаете "путаться в показаниях". На другом форуме вы пишете: Есть датасет с одним бинарным признаком(зависимой переменной) 0 или 1. Распределение 57/43 На этом: Есть очень большая выборка для бинарной классификации. Нужно предсказать 2 класса(0/1) Это как бы две совершенно разные задачи. В одном случае - обучение с учителем (т.е. датасет с признаком) , в другом - обучение без учителя (признака изначально нет). Кроме того, вы так и не пояснили, что означает поведение предсказываемых классов будет существенно отличаться. как вы себе представляете "поведение класса"? В чем оно у час выражается? Что такое "сегмент" и чем он в вашем представлении отличается от "класса". Подчеркну - "предсказываемых классов" ?? Что означает Как грамотно найти эти сегменты и поделить выборку для дальнейшего предсказания? Если вы разбиваете выборку на то-ли сегменты, то-ли классы, то что вы собираетесь предсказывать дальше? Про кластеризацию, и ее возможное использование как предварительный этап классификации вам сказали что тут, что там. Но ясности как не было, так и нет. И я еще раз повторю: Поставьте четко задачу, а то создается все более уверенное впечатление, что вы вообще не очень понимаете, а что в итоге вам надо? Сообщение отредактировал passant - 8.07.2020 - 11:32 |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
Цитата Кроме того, вы так и не пояснили, что означает поведение предсказываемых классов будет существенно отличаться. как вы себе представляете "поведение класса"? В чем оно у час выражается? Вестимо, обострение классовой борьбы... |
|
![]() |
![]() |
![]() ![]() |