Здравствуйте, гость ( Вход | Регистрация )
28.06.2017 - 01:29
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 76 Регистрация: 27.04.2014 Пользователь №: 26375 |
Подскажите, пожалуйста, кто чем может)). Я делаю логистическую регрессию. Все предикторы биноминальные (0,1). Y-зависимая переменная(бинарная 0 - нет события(это хорошо), 1-есть событие(это плохо)). Дело в том, что нули к нулям, он мало мальски правильно соотносит, но 50% единиц(плохих) у него попадают к нулям(хорошим).Т.е. неверное определение. Как понять, почему так происходит и что сделать, чтобы улучшить классификацию, хотя бы до 85% точности?
Доп. инфо, я гуглила, и нашла метод Feature Selection и его реализацию в R Boruta. Выделила 6 предикторов, думала счастье рядом, сейчас построила модель, но не тут-то было, классификация такая же некачественная:(( Может что-то не то сделала?(( Что делать? (с)(Чернышевский Н.Г.)
Прикрепленные файлы
|
|
|
![]() |
![]() |
![]() |
28.06.2017 - 08:34
Сообщение
#2
|
|
![]() Группа: Пользователи Сообщений: 105 Регистрация: 23.11.2016 Пользователь №: 28953 |
Подскажите, пожалуйста, кто чем может)). Настя, Сделал несколько вариантов анализа Вашего массива. Вот лучшее уравнение: Analysis of Maximum Likelihood Estimates Standard Wald Standardized Parameter DF Estimate Error Chi-Square Pr > ChiSq Estimate Label Intercept 1 -0.1140 0.0764 2.2259 0.1357 Intercept: Y=0 X1 1 0.5680 0.1106 26.3749 <.0001 0.2467 X1 X3 1 1.3719 0.2735 25.1699 <.0001 0.3327 X3 X5 1 2.9687 1.0229 8.4227 0.0037 0.4436 X5 X8 1 1.0929 0.4541 5.7929 0.0161 0.2349 X8 X9 1 0.8818 0.3970 4.9331 0.0263 0.1993 X9 X11 1 0.4458 0.1158 14.8159 0.0001 0.1177 X11 X14 1 0.6613 0.2686 6.0622 0.0138 0.1365 X14 X16 1 0.2207 0.1289 2.9316 0.0869 0.0606 X16 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits X1 1.765 1.421 2.192 X3 3.943 2.307 6.739 X5 19.467 2.622 144.544 X8 2.983 1.225 7.263 X9 2.415 1.109 5.259 X11 1.562 1.245 1.960 X14 1.937 1.144 3.280 X16 1.247 0.969 1.605 Association of Predicted Probabilities and Observed Responses Percent Concordant 71.8 Somers' D 0.554 Percent Discordant 16.4 Gamma 0.628 Percent Tied 11.8 Tau-a 0.229 Pairs 969847 c 0.777 Прикрепляю 2 графика с ROC-кривыми, а также таблицу сопряжённости фактических и предсказанных значений Y. Могу выслать Вам 4 больших файла (объём 8,8 Мб) с более подробными результатами. Сообщите, на какой адрес отправить эти файлы. Анализ этих результатов говорит о том, что что нужно разобраться с содержанием самого массива. И отобрать новый массив. Тогда и будут получены лучшие результаты. Сообщение отредактировал leo_biostat - 28.06.2017 - 08:40 |
|
|
![]() |
![]() |
nastushka Логистическая регрессия в R 28.06.2017 - 01:29
p2004r Цитата(nastushka @ 28.06.2017 - 01:2... 28.06.2017 - 08:07
Олег Кравец Цитата(leo_biostat @ 28.06.2017 - 08... 28.06.2017 - 18:32
p2004r Цитата(nastushka @ 28.06.2017 - 01:2... 28.06.2017 - 18:40
p2004r Цитата(nastushka @ 28.06.2017 - 01:2... 28.06.2017 - 19:46
nastushka p2004r, суперски
leo_biostat, а можете как и p2004... 28.06.2017 - 20:39
p2004r Цитата(nastushka @ 28.06.2017 - 20:3... 28.06.2017 - 23:14
nastushka Что касается данных, то такие переменные как:
x3 x... 28.06.2017 - 21:23
nokh Цитата(nastushka @ 29.06.2017 - 00:2... 28.06.2017 - 22:38
nastushka nokh, а как это сделать?)) Имеете ввиду регрессию ... 29.06.2017 - 11:46
nastushka манагер одобрил удалять совпадающие наблюдения
Под... 29.06.2017 - 18:01
p2004r Цитата(nastushka @ 29.06.2017 - 18:0... 29.06.2017 - 19:49
nastushka фух) я запарилась в ручную это перебирать)) p2004r... 30.06.2017 - 18:23
p2004r Цитата(nastushka @ 30.06.2017 - 18:2... 30.06.2017 - 23:53
nastushka p2004r
смотрите, у меня родилась мысль
вот резуль... 2.07.2017 - 15:21
p2004r Цитата(nastushka @ 2.07.2017 - 15:21... 2.07.2017 - 15:42
nastushka p2004r, у меня все получилось:)
Но возник такой в... 2.07.2017 - 20:54
p2004r Цитата(nastushka @ 2.07.2017 - 20:54... 3.07.2017 - 22:13
nastushka Терпение и труд, все перетрут) Сделала, но вот гуг... 3.07.2017 - 17:25
p2004r Цитата(nastushka @ 3.07.2017 - 17:25... 3.07.2017 - 22:10
nastushka К сожалению вопросы есть
Кодstr(df)
... 4.07.2017 - 13:23
p2004r Цитата(nastushka @ 4.07.2017 - 13:23... 4.07.2017 - 20:18
nastushka Y это isOneDay
поскольку мне сдавать нужно ,я пере... 4.07.2017 - 14:54
nastushka Да, Вы правы! p2004r, последний вопрос, интерп... 5.07.2017 - 17:51
p2004r Цитата(nastushka @ 5.07.2017 - 17:51... 5.07.2017 - 21:33
nastushka с RoC получилось разобраться. А как мне в отчете п... 6.07.2017 - 17:15
p2004r Цитата(nastushka @ 6.07.2017 - 17:15... 8.07.2017 - 23:06
nastushka p2004r, подскажите
я рассчитала spec and sens
как ... 12.07.2017 - 15:08
nastushka spec=0,06,sens=0.94 12.07.2017 - 15:12
p2004r Цитата(nastushka @ 12.07.2017 - 15:1... 12.07.2017 - 18:49
nastushka И такой вопросик
data(ROCR.simple)
threshold1 ... 12.07.2017 - 18:34
p2004r Цитата(nastushka @ 12.07.2017 - 18:3... 12.07.2017 - 18:43
nokh Похоже мой ответ на письмо в личку не дошёл, дубли... 12.07.2017 - 18:35
p2004r Цитата(nokh @ 12.07.2017 - 18:35) По... 12.07.2017 - 18:41
nastushka не-не он дошел, только что прочла:))) 12.07.2017 - 18:36
nastushka поняла 12.07.2017 - 18:56
nastushka я просто так считала 12.07.2017 - 18:59
nastushka sensetivity=tp/(tp+fn) доля верных предсказаний п... 12.07.2017 - 19:00
DrgLena spe=1-0,06=0,94 12.07.2017 - 19:24
nastushka вы имеете ввиду, что 0,06 это чувствительность? 12.07.2017 - 19:46
100$ Цитата(nastushka @ 12.07.2017 - 19:4... 12.07.2017 - 20:35
DrgLena Нет, вы привели таблицу из которой можно посчитат... 12.07.2017 - 20:37
nastushka все поняла ошибку. 12.07.2017 - 20:45
nastushka p2004r, здравствуйте, решила написать в своем же т... 5.08.2017 - 17:10
p2004r Цитата(nastushka @ 5.08.2017 - 17:10... 6.08.2017 - 14:29
nastushka у меня AUc=0.55, в R считала, неужели мне никак мо... 6.08.2017 - 14:57
p2004r Цитата(nastushka @ 6.08.2017 - 14:57... 6.08.2017 - 16:39
nastushka Кстати точно, попробую, прологарифмировать.
Подска... 6.08.2017 - 17:53
p2004r Цитата(nastushka @ 6.08.2017 - 17:53... 6.08.2017 - 20:19
nastushka p2004r, подскажите, пожалуйста, а как мне нарисова... 8.08.2017 - 11:45
p2004r Цитата(nastushka @ 8.08.2017 - 11:45... 8.08.2017 - 19:08
nastushka p2004r, Ваше мнение, как Вы считаете имеет ли мест... 9.08.2017 - 15:43
p2004r Цитата(nastushka @ 9.08.2017 - 15:43... 10.08.2017 - 00:16
nastushka Т.е. вы считаете, что такую верификацию из двух ме... 10.08.2017 - 11:16
p2004r Цитата(nastushka @ 10.08.2017 - 11:1... 10.08.2017 - 16:50
nastushka p2004r, я пробовала работать с тремя этими пакетам... 12.08.2017 - 13:35
p2004r Цитата(nastushka @ 12.08.2017 - 13:3... 14.08.2017 - 16:27![]() ![]() |