Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Логистическая регрессия в R
nastushka
сообщение 28.06.2017 - 01:29
Сообщение #1





Группа: Пользователи
Сообщений: 76
Регистрация: 27.04.2014
Пользователь №: 26375



Подскажите, пожалуйста, кто чем может)). Я делаю логистическую регрессию. Все предикторы биноминальные (0,1). Y-зависимая переменная(бинарная 0 - нет события(это хорошо), 1-есть событие(это плохо)). Дело в том, что нули к нулям, он мало мальски правильно соотносит, но 50% единиц(плохих) у него попадают к нулям(хорошим).Т.е. неверное определение. Как понять, почему так происходит и что сделать, чтобы улучшить классификацию, хотя бы до 85% точности?
Доп. инфо, я гуглила, и нашла метод Feature Selection и его реализацию в R Boruta. Выделила 6 предикторов, думала счастье рядом, сейчас построила модель, но не тут-то было, классификация такая же некачественная:((
Может что-то не то сделала?((
Что делать? (с)(Чернышевский Н.Г.)
Прикрепленные файлы
Прикрепленный файл  data.zip ( 5,13 килобайт ) Кол-во скачиваний: 333
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
leo_biostat
сообщение 28.06.2017 - 08:34
Сообщение #2





Группа: Пользователи
Сообщений: 105
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(nastushka @ 28.06.2017 - 01:29) *
Подскажите, пожалуйста, кто чем может)).


Настя, hi.gif!

Сделал несколько вариантов анализа Вашего массива.
Вот лучшее уравнение:

Analysis of Maximum Likelihood Estimates

Standard Wald Standardized
Parameter DF Estimate Error Chi-Square Pr > ChiSq Estimate Label

Intercept 1 -0.1140 0.0764 2.2259 0.1357 Intercept: Y=0
X1 1 0.5680 0.1106 26.3749 <.0001 0.2467 X1
X3 1 1.3719 0.2735 25.1699 <.0001 0.3327 X3
X5 1 2.9687 1.0229 8.4227 0.0037 0.4436 X5
X8 1 1.0929 0.4541 5.7929 0.0161 0.2349 X8
X9 1 0.8818 0.3970 4.9331 0.0263 0.1993 X9
X11 1 0.4458 0.1158 14.8159 0.0001 0.1177 X11
X14 1 0.6613 0.2686 6.0622 0.0138 0.1365 X14
X16 1 0.2207 0.1289 2.9316 0.0869 0.0606 X16


Odds Ratio Estimates

Point 95% Wald
Effect Estimate Confidence Limits

X1 1.765 1.421 2.192
X3 3.943 2.307 6.739
X5 19.467 2.622 144.544
X8 2.983 1.225 7.263
X9 2.415 1.109 5.259
X11 1.562 1.245 1.960
X14 1.937 1.144 3.280
X16 1.247 0.969 1.605


Association of Predicted Probabilities and Observed Responses

Percent Concordant 71.8 Somers' D 0.554
Percent Discordant 16.4 Gamma 0.628
Percent Tied 11.8 Tau-a 0.229
Pairs 969847 c 0.777

Прикрепляю 2 графика с ROC-кривыми, а также таблицу сопряжённости фактических и предсказанных значений Y.

Могу выслать Вам 4 больших файла (объём 8,8 Мб) с более подробными результатами. Сообщите, на какой адрес отправить эти файлы.
Анализ этих результатов говорит о том, что что нужно разобраться с содержанием самого массива.
И отобрать новый массив.
Тогда и будут получены лучшие результаты.

Сообщение отредактировал leo_biostat - 28.06.2017 - 08:40
Эскизы прикрепленных изображений
Прикрепленное изображение
Прикрепленное изображение
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Олег Кравец
сообщение 28.06.2017 - 18:32
Сообщение #3





Группа: Модераторы
Сообщений: 286
Регистрация: 1.02.2005
Из: Воронеж
Пользователь №: 93



Цитата(leo_biostat @ 28.06.2017 - 08:34) *
Сделал несколько вариантов анализа Вашего массива.


Спасибо. Прекрасный пример помощи.


Signature
О.Я.Кравец, д.т.н., проф.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- nastushka   Логистическая регрессия в R   28.06.2017 - 01:29
- - p2004r   Цитата(nastushka @ 28.06.2017 - 01:2...   28.06.2017 - 08:07
- - leo_biostat   Цитата(nastushka @ 28.06.2017 - 01:2...   28.06.2017 - 08:34
|- - Олег Кравец   Цитата(leo_biostat @ 28.06.2017 - 08...   28.06.2017 - 18:32
- - p2004r   Цитата(nastushka @ 28.06.2017 - 01:2...   28.06.2017 - 18:40
- - p2004r   Цитата(nastushka @ 28.06.2017 - 01:2...   28.06.2017 - 19:46
- - nastushka   p2004r, суперски leo_biostat, а можете как и p2004...   28.06.2017 - 20:39
|- - p2004r   Цитата(nastushka @ 28.06.2017 - 20:3...   28.06.2017 - 23:14
- - nastushka   Что касается данных, то такие переменные как: x3 x...   28.06.2017 - 21:23
|- - nokh   Цитата(nastushka @ 29.06.2017 - 00:2...   28.06.2017 - 22:38
- - nastushka   nokh, а как это сделать?)) Имеете ввиду регрессию ...   29.06.2017 - 11:46
- - nastushka   манагер одобрил удалять совпадающие наблюдения Под...   29.06.2017 - 18:01
|- - p2004r   Цитата(nastushka @ 29.06.2017 - 18:0...   29.06.2017 - 19:49
- - nastushka   фух) я запарилась в ручную это перебирать)) p2004r...   30.06.2017 - 18:23
|- - p2004r   Цитата(nastushka @ 30.06.2017 - 18:2...   30.06.2017 - 23:53
- - nastushka   p2004r смотрите, у меня родилась мысль вот резуль...   2.07.2017 - 15:21
|- - p2004r   Цитата(nastushka @ 2.07.2017 - 15:21...   2.07.2017 - 15:42
- - nastushka   p2004r, у меня все получилось:) Но возник такой в...   2.07.2017 - 20:54
|- - p2004r   Цитата(nastushka @ 2.07.2017 - 20:54...   3.07.2017 - 22:13
- - nastushka   Терпение и труд, все перетрут) Сделала, но вот гуг...   3.07.2017 - 17:25
|- - p2004r   Цитата(nastushka @ 3.07.2017 - 17:25...   3.07.2017 - 22:10
- - nastushka   К сожалению вопросы есть Кодstr(df) ...   4.07.2017 - 13:23
|- - p2004r   Цитата(nastushka @ 4.07.2017 - 13:23...   4.07.2017 - 20:18
- - nastushka   Y это isOneDay поскольку мне сдавать нужно ,я пере...   4.07.2017 - 14:54
- - nastushka   Да, Вы правы! p2004r, последний вопрос, интерп...   5.07.2017 - 17:51
|- - p2004r   Цитата(nastushka @ 5.07.2017 - 17:51...   5.07.2017 - 21:33
- - nastushka   с RoC получилось разобраться. А как мне в отчете п...   6.07.2017 - 17:15
|- - p2004r   Цитата(nastushka @ 6.07.2017 - 17:15...   8.07.2017 - 23:06
- - nastushka   p2004r, подскажите я рассчитала spec and sens как ...   12.07.2017 - 15:08
- - nastushka   spec=0,06,sens=0.94   12.07.2017 - 15:12
|- - p2004r   Цитата(nastushka @ 12.07.2017 - 15:1...   12.07.2017 - 18:49
- - nastushka   И такой вопросик data(ROCR.simple) threshold1 ...   12.07.2017 - 18:34
|- - p2004r   Цитата(nastushka @ 12.07.2017 - 18:3...   12.07.2017 - 18:43
- - nokh   Похоже мой ответ на письмо в личку не дошёл, дубли...   12.07.2017 - 18:35
|- - p2004r   Цитата(nokh @ 12.07.2017 - 18:35) По...   12.07.2017 - 18:41
- - nastushka   не-не он дошел, только что прочла:)))   12.07.2017 - 18:36
- - nastushka   поняла   12.07.2017 - 18:56
- - nastushka   я просто так считала   12.07.2017 - 18:59
- - nastushka   sensetivity=tp/(tp+fn) доля верных предсказаний п...   12.07.2017 - 19:00
- - DrgLena   spe=1-0,06=0,94   12.07.2017 - 19:24
- - nastushka   вы имеете ввиду, что 0,06 это чувствительность?   12.07.2017 - 19:46
|- - 100$   Цитата(nastushka @ 12.07.2017 - 19:4...   12.07.2017 - 20:35
- - DrgLena   Нет, вы привели таблицу из которой можно посчитат...   12.07.2017 - 20:37
- - nastushka   все поняла ошибку.   12.07.2017 - 20:45
- - nastushka   p2004r, здравствуйте, решила написать в своем же т...   5.08.2017 - 17:10
|- - p2004r   Цитата(nastushka @ 5.08.2017 - 17:10...   6.08.2017 - 14:29
- - nastushka   у меня AUc=0.55, в R считала, неужели мне никак мо...   6.08.2017 - 14:57
|- - p2004r   Цитата(nastushka @ 6.08.2017 - 14:57...   6.08.2017 - 16:39
- - nastushka   Кстати точно, попробую, прологарифмировать. Подска...   6.08.2017 - 17:53
|- - p2004r   Цитата(nastushka @ 6.08.2017 - 17:53...   6.08.2017 - 20:19
- - nastushka   p2004r, подскажите, пожалуйста, а как мне нарисова...   8.08.2017 - 11:45
|- - p2004r   Цитата(nastushka @ 8.08.2017 - 11:45...   8.08.2017 - 19:08
- - nastushka   p2004r, Ваше мнение, как Вы считаете имеет ли мест...   9.08.2017 - 15:43
|- - p2004r   Цитата(nastushka @ 9.08.2017 - 15:43...   10.08.2017 - 00:16
- - nastushka   Т.е. вы считаете, что такую верификацию из двух ме...   10.08.2017 - 11:16
|- - p2004r   Цитата(nastushka @ 10.08.2017 - 11:1...   10.08.2017 - 16:50
- - nastushka   p2004r, я пробовала работать с тремя этими пакетам...   12.08.2017 - 13:35
- - p2004r   Цитата(nastushka @ 12.08.2017 - 13:3...   14.08.2017 - 16:27


Добавить ответ в эту темуОткрыть тему