![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]() ![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 76 Регистрация: 27.04.2014 Пользователь №: 26375 ![]() |
Подскажите, пожалуйста, кто чем может)). Я делаю логистическую регрессию. Все предикторы биноминальные (0,1). Y-зависимая переменная(бинарная 0 - нет события(это хорошо), 1-есть событие(это плохо)). Дело в том, что нули к нулям, он мало мальски правильно соотносит, но 50% единиц(плохих) у него попадают к нулям(хорошим).Т.е. неверное определение. Как понять, почему так происходит и что сделать, чтобы улучшить классификацию, хотя бы до 85% точности?
Доп. инфо, я гуглила, и нашла метод Feature Selection и его реализацию в R Boruta. Выделила 6 предикторов, думала счастье рядом, сейчас построила модель, но не тут-то было, классификация такая же некачественная:(( Может что-то не то сделала?(( Что делать? (с)(Чернышевский Н.Г.)
Прикрепленные файлы
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 76 Регистрация: 27.04.2014 Пользователь №: 26375 ![]() |
p2004r
смотрите, у меня родилась мысль вот результаты классификации random forest Confusion matrix: 0 1 class.error 0 831 3 0.003597122302 1 103 528 0.163232963550 Как мне найти номера наблюдений единиц, которые попали в нули, 103 штучки?)) |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
p2004r смотрите, у меня родилась мысль вот результаты классификации random forest Confusion matrix: 0 1 class.error 0 831 3 0.003597122302 1 103 528 0.163232963550 Как мне найти номера наблюдений единиц, которые попали в нули, 103 штучки?)) Два вектора v1 и v2 (обучение df$Y и решение_RF res.rf$predicted) which(v1==1&v2==0) ![]() |
|
![]() |
![]() |
![]() ![]() |