Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Логистическая регрессия в R
nastushka
сообщение 28.06.2017 - 01:29
Сообщение #1





Группа: Пользователи
Сообщений: 76
Регистрация: 27.04.2014
Пользователь №: 26375



Подскажите, пожалуйста, кто чем может)). Я делаю логистическую регрессию. Все предикторы биноминальные (0,1). Y-зависимая переменная(бинарная 0 - нет события(это хорошо), 1-есть событие(это плохо)). Дело в том, что нули к нулям, он мало мальски правильно соотносит, но 50% единиц(плохих) у него попадают к нулям(хорошим).Т.е. неверное определение. Как понять, почему так происходит и что сделать, чтобы улучшить классификацию, хотя бы до 85% точности?
Доп. инфо, я гуглила, и нашла метод Feature Selection и его реализацию в R Boruta. Выделила 6 предикторов, думала счастье рядом, сейчас построила модель, но не тут-то было, классификация такая же некачественная:((
Может что-то не то сделала?((
Что делать? (с)(Чернышевский Н.Г.)
Прикрепленные файлы
Прикрепленный файл  data.zip ( 5,13 килобайт ) Кол-во скачиваний: 333
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nastushka
сообщение 28.06.2017 - 20:39
Сообщение #2





Группа: Пользователи
Сообщений: 76
Регистрация: 27.04.2014
Пользователь №: 26375



p2004r, суперски
leo_biostat, а можете как и p2004r тоже дать исходный код, хочу сама получить такие ре-ты:))
p2004r, что касается дровишек ,я не могу говорить, поэтому и закодировала в иксы и игрике, но это фин скоринг .
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 28.06.2017 - 23:14
Сообщение #3





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(nastushka @ 28.06.2017 - 20:39) *
p2004r, суперски
leo_biostat, а можете как и p2004r тоже дать исходный код, хочу сама получить такие ре-ты:))
p2004r, что касается дровишек ,я не могу говорить, поэтому и закодировала в иксы и игрике, но это фин скоринг .



Там очень уж совпадает часть случаев, надо проверить не смешались ли каким то образом данные в процессе их подготовки. Не может быть таких совпадений по численности вариантов ответов.

Код
> nrow(unique(df[,-1]))
[1] 414
> nrow(df[,-1])
[1] 2168

> table(do.call(paste0,as.list(df[,-1])), df$Y)
                  
                     0   1
  0000000000000000  36  36
  0000000000000011   2   2
  0000000000000100   1   1
  0000000000000111   1   1
  0000000000001000  18  18
  0000000000001011   3   3
  0000000000001111   1   1
  0000000000010000 146 146
  0000000000010010   2   2
  0000000000010011  29  29
  0000000000010100   1   1
  0000000000010110   2   2
  0000000000011000  88  88
  0000000000011011  23  23
  0000000000011100   1   1
  0000000000100000  17  15
  0000000000100011   8   3
  0000000000100100   1   0
  0000000000100111   2   0
  0000000000101000  11  10
  0000000000101010   1   1
  0000000000101011   5   0
  0000000000101111   3   0
  0000000000110000  75  72
  0000000000110010   2   2
  0000000000110011  36  28
  0000000000110100   4   2
  0000000000110111   3   1
  0000000000111000  44  39
  0000000000111001   1   1
  0000000000111010   4   3
  0000000000111011  16  11
  0000000000111100   2   1
  0000000000111111   8   2
  0000000010111011   2   2
  0000000101100111   1   0
  0000000101101011   1   0
  0000000101110000   1   0
  0000000101110111   1   0
  0000000101111000   1   0
  0000000101111100   1   0
  0000000111100011   1   0
  0000000111100111   2   0
  0000000111101000   1   0
  0000000111101011   1   0
  0000000111101100   1   0
  0000000111110011   1   0
  0000000111110111   2   0
  0000000111111011   3   0
  0000000111111111   3   0
  0000110000100000   3   0
  0000110000100100   7   0
  0000110000101100   4   0
  0000110000110000   1   0
  0000110000110100   4   0
  0000110000111000   1   0
  0000110000111100   2   0
  0000110010100000   1   0
  0000110010101000   2   0
  0000110010110000   1   0
  0000110010110100   2   0
  0000110010111000   3   0
  0000110101110100   1   0
  0000110101111000   1   0
  0000110111100000   4   0
  0000110111100100   3   0
  0000110111101000   3   0
  0000110111110100   5   0
  0000110111111000   1   0
  0011000000010000   1   1
  0011000000100000   1   1
  0011000000100111   1   1
  0011000000110011   4   0
  0011000000110111   2   0
  0011000000111000   3   1
  0011000000111011   8   2
  0011000000111111   5   0
  0011000010100011   2   0
  0011000010101000   1   0
  0011000010110011   3   0
  0011000010110111   2   0
  0011000010111000   1   0
  0011000010111011   5   0
  0011000010111111   3   0
  0011000101100011   2   0
  0011000101100111   1   0
  0011000101101011   3   0
  0011000101101111   2   0
  0011000101111111   4   0
  0011000111100111   2   0
  0011000111101011   3   0
  0011000111101111   9   0
  0011000111110011   4   0
  0011000111110111   3   0
  0011000111111010   1   0
  0011000111111011   5   0
  0011000111111111   3   0
  0011001000110011   1   0
  0011001111100111   1   0
  0011110000100000   1   0
  0011110000100100   9   0
  0011110000101000   1   0
  0011110000101100   1   0
  0011110000110100   5   0
  0011110000111000   1   0
  0011110000111100   2   0
  0011110010100000   2   0
  0011110010100011   1   0
  0011110010101000   1   0
  0011110010110000   1   0
  0011110010110011   2   0
  0011110010111000   1   0
  0011110010111111   1   0
  0011110101100100   1   0
  0011110101101000   1   0
  0011110101101011   1   0
  0011110101101100   1   0
  0011110101111100   2   0
  0011110111100000   2   0
  0011110111100011   1   0
  0011110111100100   3   0
  0011110111101011   2   0
  0011110111101100   1   0
  0011110111101111   1   0
  0011110111110011   2   0
  0011110111110100   3   0
  0011110111111011   1   0
  0011110111111100   1   0
  0011111101110000   1   0
  0011111111101100   1   0
  0100000000101000   1   0
  0100000000101011   1   0
  0100000000110011   1   1
  0100000000110100   1   0
  0100000010101111   1   0
  0100000010110011   1   0
  0100000010111011   2   0
  0100000101100011   1   0
  0100000101111011   1   0
  0100000111100000   1   0
  0100000111100011   2   0
  0100000111100100   1   0
  0100000111100111   2   0
  0100000111101011   2   0
  0100000111101111   3   1
  0100000111110011   2   0
  0100000111110100   2   0
  0100000111110111   4   0
  0100000111111011   3   0
  0100000111111111   6   0
  0100001111110111   1   0
  0100001111111111   3   0
  0100110000110100   1   0
  0100110010100000   1   0
  0100110111100000   1   0
  0100110111100111   1   0
  0100110111101000   1   0
  0100110111111000   2   0
  0100110111111111   1   0
  0111000000110000   1   0
  0111000000110011   1   0
  0111000000110101   1   0
  0111000000110111   1   0
  0111000000111011   1   0
  0111000000111111   1   0
  0111000010100111   2   0
  0111000010101011   1   0
  0111000010101111   1   0
  0111000010110000   1   0
  0111000010110011   2   0
  0111000010110111   2   0
  0111000010111111   1   0
  0111000101100100   1   0
  0111000101100111   1   0
  0111000101111011   2   1
  0111000111100000   1   0
  0111000111100011   7   0
  0111000111100100   4   0
  0111000111100111   4   0
  0111000111101000   1   0
  0111000111101011   7   0
  0111000111101111  10   1
  0111000111110011   8   0
  0111000111110100   3   0
  0111000111110111  14   0
  0111000111111000   1   0
  0111000111111011  14   0
  0111000111111100   3   0
  0111000111111111  16   0
  0111001010101100   1   0
  0111001111100111   2   0
  0111001111101111   1   0
  0111001111110111   1   0
  0111001111111111   1   0
  0111110000100111   1   0
  0111110000101111   1   0
  0111110010100000   1   0
  0111110010100111   1   0
  0111110010110000   2   0
  0111110010110100   1   0
  0111110010110111   1   0
  0111110101101000   1   0
  0111110101110000   1   0
  0111110101111111   1   0
  0111110111100000   1   0
  0111110111100011   1   0
  0111110111100111   4   0
  0111110111101000   5   0
  0111110111101011   3   0
  0111110111101100   3   0
  0111110111101111   5   0
  0111110111110000   2   0
  0111110111110011   2   0
  0111110111110100   4   0
  0111110111110111   3   0
  0111110111111000   3   0
  0111110111111011   5   0
  0111110111111100   1   0
  0111110111111111   7   1
  0111111111110000   1   0
  1000000000000011   2   2
  1000000000010000   6   6
  1000000000010001   2   2
  1000000000010010   2   2
  1000000000010011   5   5
  1000000000011000   1   1
  1000000000011011   3   3
  1000000000100000   5   0
  1000000000100011   9   0
  1000000000101000   1   0
  1000000000101011   6   0
  1000000000101111   1   0
  1000000000110000  25   4
  1000000000110001   1   1
  1000000000110010   4   1
  1000000000110011  25   5
  1000000000110100   1   1
  1000000000110111   2   0
  1000000000111000   9   3
  1000000000111010   1   1
  1000000000111011  25   2
  1000000000111100   1   1
  1000000000111111   1   0
  1000000010100011   1   1
  1000000010110011   5   1
  1000000010111000   1   1
  1000000010111011   1   0
  1000000010111111   1   0
  1000000101110011   1   0
  1000000111110000   1   0
  1000000111110011   1   1
  1011000000100000   3   0
  1011000000100011   5   0
  1011000000101000   3   0
  1011000000101011   4   0
  1011000000110000   2   0
  1011000000110011  18   2
  1011000000111000   4   1
  1011000000111011  17   1
  1011000000111110   1   0
  1011000000111111   1   0
  1011000010101011   1   0
  1011000010110011   4   0
  1011000010111011   1   0
  1011000010111111   1   0
  1011000101101011   1   0
  1011000101111000   1   0
  1011000101111011   1   0
  1011000111110011   1   0
  1100000000011000   1   1
  1100000000110011   1   0
  1100000000110111   1   0
  1100000000111011   3   1
  1100000010110111   1   0
  1100000111110011   1   0
  1111000000100000   1   0
  1111000000100011   1   0
  1111000000101011   1   0
  1111000000110011   3   0
  1111000000110100   1   0
  1111000000111000   1   0
  1111000000111011   3   0
  1111000000111111   1   0
  1111000010110011   1   0
  1111000010111011   1   0
  1111000101110011   1   0
  1111000111101011   1   0
  1111000111110011   1   0
  1111000111111011   1   0
  2000000000000000   1   1
  2000000000010000   2   2
  2000000000010001   1   1
  2000000000010011   1   1
  2000000000011000   1   1
  2000000000100011   1   0
  2000000000101011   2   1
  2000000000110000   1   0
  2000000000110010   1   1
  2000000000110011  15   4
  2000000000110110   1   0
  2000000000110111   3   0
  2000000000111000   3   0
  2000000000111011  19   2
  2000000000111111   3   0
  2000000010101011   1   0
  2000000010110011   1   0
  2000000010110111   1   0
  2000000010111011   1   0
  2000000101101011   1   0
  2000000101110111   1   0
  2000000101111011   3   2
  2000000101111111   1   0
  2000000111110011   1   0
  2000000111111011   2   0
  2000000111111110   1   0
  2011000000000011   1   1
  2011000000100011   4   0
  2011000000101011   7   0
  2011000000101111   1   0
  2011000000110000   1   0
  2011000000110011   6   1
  2011000000110111   3   0
  2011000000111011  14   0
  2011000000111111   1   0
  2011000010100011   1   0
  2011000010101011   1   0
  2011000010110011   3   0
  2011000010111011   7   0
  2011000010111111   1   0
  2011000101101011   3   0
  2011000101101111   1   0
  2011000101110000   1   0
  2011000101110011   2   0
  2011000101110111   1   0
  2011000111100111   1   0
  2011000111101011   3   0
  2011000111110000   1   0
  2011000111110011   2   0
  2011000111110111   1   0
  2011000111111011   2   0
  2011000111111111   6   0
  2100000000100000   2   0
  2100000000110011   2   1
  2100000000111011   2   0
  2100000000111111   1   0
  2100000010111011   1   0
  2100000101111011   1   0
  2100000101111100   1   0
  2100000111101011   1   0
  2100000111111011   1   0
  2100000111111111   1   0
  2111000000010011   1   1
  2111000000100011   1   0
  2111000000110111   1   0
  2111000000111011   2   0
  2111000000111111   3   0
  2111000010100111   1   0
  2111000010101011   1   0
  2111000010101111   1   0
  2111000010110011   2   0
  2111000010110111   1   0
  2111000010111011   5   0
  2111000111100011   2   0
  2111000111101011   2   0
  2111000111110011   2   0
  2111000111110111   2   0
  2111000111111011   6   0
  3000000000100011   2   0
  3000000000100111   1   0
  3000000000110000   1   0
  3000000000110011   1   0
  3000000000111011   4   0
  3000000000111111   1   0
  3000000010100011   1   0
  3000000010101011   2   1
  3000000101111011   1   0
  3000000111110011   2   0
  3000000111111111   2   0
  3011000000101011   1   0
  3011000000110011   1   0
  3011000000110111   1   1
  3011000000111011   4   0
  3011000000111111   1   0
  3011000010101011   1   0
  3011000010101111   1   0
  3011000010111111   1   0
  3011000101100011   1   0
  3011000111100011   1   1
  3011000111101011   1   0
  3011000111101111   1   0
  3011000111111011   4   0
  3011000111111111   2   0
  3011001010111011   1   0
  3100000000101111   1   0
  3100000000110111   1   0
  3100000000111111   1   0
  3100000010111011   1   0
  3100000101110011   1   0
  3100000111100011   1   0
  3100000111101111   2   0
  3100000111111111   2   0
  3111000000100011   1   0
  3111000000101011   1   0
  3111000000111011   1   0
  3111000010101011   1   0
  3111000101111011   1   0
  3111000111100011   1   0
  3111000111100111   1   0
  3111000111101011   1   0
  3111000111101111   1   0
  3111000111110011   1   0
  3111000111111011   1   0
  3111000111111111   1   0
  3111001111111111   1   0


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- nastushka   Логистическая регрессия в R   28.06.2017 - 01:29
- - p2004r   Цитата(nastushka @ 28.06.2017 - 01:2...   28.06.2017 - 08:07
- - leo_biostat   Цитата(nastushka @ 28.06.2017 - 01:2...   28.06.2017 - 08:34
|- - Олег Кравец   Цитата(leo_biostat @ 28.06.2017 - 08...   28.06.2017 - 18:32
- - p2004r   Цитата(nastushka @ 28.06.2017 - 01:2...   28.06.2017 - 18:40
- - p2004r   Цитата(nastushka @ 28.06.2017 - 01:2...   28.06.2017 - 19:46
- - nastushka   p2004r, суперски leo_biostat, а можете как и p2004...   28.06.2017 - 20:39
|- - p2004r   Цитата(nastushka @ 28.06.2017 - 20:3...   28.06.2017 - 23:14
- - nastushka   Что касается данных, то такие переменные как: x3 x...   28.06.2017 - 21:23
|- - nokh   Цитата(nastushka @ 29.06.2017 - 00:2...   28.06.2017 - 22:38
- - nastushka   nokh, а как это сделать?)) Имеете ввиду регрессию ...   29.06.2017 - 11:46
- - nastushka   манагер одобрил удалять совпадающие наблюдения Под...   29.06.2017 - 18:01
|- - p2004r   Цитата(nastushka @ 29.06.2017 - 18:0...   29.06.2017 - 19:49
- - nastushka   фух) я запарилась в ручную это перебирать)) p2004r...   30.06.2017 - 18:23
|- - p2004r   Цитата(nastushka @ 30.06.2017 - 18:2...   30.06.2017 - 23:53
- - nastushka   p2004r смотрите, у меня родилась мысль вот резуль...   2.07.2017 - 15:21
|- - p2004r   Цитата(nastushka @ 2.07.2017 - 15:21...   2.07.2017 - 15:42
- - nastushka   p2004r, у меня все получилось:) Но возник такой в...   2.07.2017 - 20:54
|- - p2004r   Цитата(nastushka @ 2.07.2017 - 20:54...   3.07.2017 - 22:13
- - nastushka   Терпение и труд, все перетрут) Сделала, но вот гуг...   3.07.2017 - 17:25
|- - p2004r   Цитата(nastushka @ 3.07.2017 - 17:25...   3.07.2017 - 22:10
- - nastushka   К сожалению вопросы есть Кодstr(df) ...   4.07.2017 - 13:23
|- - p2004r   Цитата(nastushka @ 4.07.2017 - 13:23...   4.07.2017 - 20:18
- - nastushka   Y это isOneDay поскольку мне сдавать нужно ,я пере...   4.07.2017 - 14:54
- - nastushka   Да, Вы правы! p2004r, последний вопрос, интерп...   5.07.2017 - 17:51
|- - p2004r   Цитата(nastushka @ 5.07.2017 - 17:51...   5.07.2017 - 21:33
- - nastushka   с RoC получилось разобраться. А как мне в отчете п...   6.07.2017 - 17:15
|- - p2004r   Цитата(nastushka @ 6.07.2017 - 17:15...   8.07.2017 - 23:06
- - nastushka   p2004r, подскажите я рассчитала spec and sens как ...   12.07.2017 - 15:08
- - nastushka   spec=0,06,sens=0.94   12.07.2017 - 15:12
|- - p2004r   Цитата(nastushka @ 12.07.2017 - 15:1...   12.07.2017 - 18:49
- - nastushka   И такой вопросик data(ROCR.simple) threshold1 ...   12.07.2017 - 18:34
|- - p2004r   Цитата(nastushka @ 12.07.2017 - 18:3...   12.07.2017 - 18:43
- - nokh   Похоже мой ответ на письмо в личку не дошёл, дубли...   12.07.2017 - 18:35
|- - p2004r   Цитата(nokh @ 12.07.2017 - 18:35) По...   12.07.2017 - 18:41
- - nastushka   не-не он дошел, только что прочла:)))   12.07.2017 - 18:36
- - nastushka   поняла   12.07.2017 - 18:56
- - nastushka   я просто так считала   12.07.2017 - 18:59
- - nastushka   sensetivity=tp/(tp+fn) доля верных предсказаний п...   12.07.2017 - 19:00
- - DrgLena   spe=1-0,06=0,94   12.07.2017 - 19:24
- - nastushka   вы имеете ввиду, что 0,06 это чувствительность?   12.07.2017 - 19:46
|- - 100$   Цитата(nastushka @ 12.07.2017 - 19:4...   12.07.2017 - 20:35
- - DrgLena   Нет, вы привели таблицу из которой можно посчитат...   12.07.2017 - 20:37
- - nastushka   все поняла ошибку.   12.07.2017 - 20:45
- - nastushka   p2004r, здравствуйте, решила написать в своем же т...   5.08.2017 - 17:10
|- - p2004r   Цитата(nastushka @ 5.08.2017 - 17:10...   6.08.2017 - 14:29
- - nastushka   у меня AUc=0.55, в R считала, неужели мне никак мо...   6.08.2017 - 14:57
|- - p2004r   Цитата(nastushka @ 6.08.2017 - 14:57...   6.08.2017 - 16:39
- - nastushka   Кстати точно, попробую, прологарифмировать. Подска...   6.08.2017 - 17:53
|- - p2004r   Цитата(nastushka @ 6.08.2017 - 17:53...   6.08.2017 - 20:19
- - nastushka   p2004r, подскажите, пожалуйста, а как мне нарисова...   8.08.2017 - 11:45
|- - p2004r   Цитата(nastushka @ 8.08.2017 - 11:45...   8.08.2017 - 19:08
- - nastushka   p2004r, Ваше мнение, как Вы считаете имеет ли мест...   9.08.2017 - 15:43
|- - p2004r   Цитата(nastushka @ 9.08.2017 - 15:43...   10.08.2017 - 00:16
- - nastushka   Т.е. вы считаете, что такую верификацию из двух ме...   10.08.2017 - 11:16
|- - p2004r   Цитата(nastushka @ 10.08.2017 - 11:1...   10.08.2017 - 16:50
- - nastushka   p2004r, я пробовала работать с тремя этими пакетам...   12.08.2017 - 13:35
- - p2004r   Цитата(nastushka @ 12.08.2017 - 13:3...   14.08.2017 - 16:27


Добавить ответ в эту темуОткрыть тему