Вопрос по логистической регрессии - Форум врачей-аспирантов

Вопрос по логистической регрессии

lab_owl Просмотр профиля	26.02.2009 - 20:00 Сообщение #1
Группа: Пользователи Сообщений: 8 Регистрация: 26.02.2009 Пользователь №: 5862	Уважаемые коллеги! Я новичок в статистике, поэтому заранее извинюсь за, быть может, наивные вопросы. Они касаются логистической регресии. Имеются данные некоторого потенциально значимого диагностического теста (read-out - да/нет, соотв. 0/1) для дифференциальной диагностики доброкачественных и злокачественных узловых образований ЩЖ (соотв-но, зависимая переменная - «зло»(1)/«добро»(0)), независимые переменные (помимо рез-та изучаемого теста) - пол, возраст и наличие/отсутствие (1/0) подозрительных на малигнизацию изменений на цитограмме пунктата. Строю модель (SPSS, binary logistic regession). В результате по переменной, соответствующей рез-там диагностического теста - гипердисперсия, низкая статистика Вальда и отсутствие значимости переменной. Ситуация в том, что тест высокоспецифичный (но низкочувствительный), и на относительно небольшой выборке ни одного тест-позитивного случая в группе пациентов с доброкачественными образованиями не наблюдается. При произвольном введении одного тест-позитива в эту группу (в любой case) ситуация полностью исправляется, ошибка становится вполне приемлемой и переменная становится значимой. При этом % верных предсказаний в «неадеватной» модели даже выше (что логично). Собственно вопросы: 1) Неадекватность модели при отсутствии тест-позитивных случаев в одной из групп - это внутренняя особенность алгоритма или еще что-то? 2) Если это внутренняя особенность алгоритма, то каковы методы борьбы (не считая дальнейшего сбора материала в ожидании хотя бы одного тест-позитивного случая)? Заранее спасибо за советы и рекомендации. Сообщение отредактировал lab_owl - 26.02.2009 - 20:05

Ответов

DrgLena Просмотр профиля	11.01.2012 - 11:09 Сообщение #2
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Цитата(Игорь @ 10.01.2012 - 20:54) sex - не бинарный признак, а номинальный с двумя градациями (и гермафродит, а также другие врожденные, приобретенные и психические отклонения тут не при чем), поэтому для него также требуется в логистической модели вводить фиктивные (dummy) переменные. Конечно, в каких-то опросниках можно закодировать пол как 0 и 1, но применение данных чисел в расчетах приведет к ошибке - признаки для расчетов необходимо перекодировать в dummy переменные. http://www.hse.ru/data/2011/11/30/12711271...ution_Dummy.pdf Фиктивные переменные в отечественной литературе имеют термин структурных переменных и они вводятся не только в логистические модели. В качестве фиктивных переменных обычно используются дихотомические переменные, которые принимают всего два значения ?0? и ?1?, например, значение ?0? - ж и ?1? м для переменной пол. В этом случае ничего создавать не нужно, они вводятся в уравнение именно в таком виде, что облегчает трактовку коэффициентов, но называться могут ?фиктивные?. Если градаций больше двух, то в регрессионную модель вводят k-1 бинарных переменных. ?Фиктивные переменные? - это не совсем удачный перевод dummy var поскольку они вовсе не фиктивные, их фиктивность лишь в том, что они количественным образом описывают качественный признак.

Игорь Просмотр профиля	13.01.2012 - 05:39 Сообщение #3
Группа: Пользователи Сообщений: 1162 Регистрация: 10.04.2007 Пользователь №: 4040	Цитата(DrgLena @ 11.01.2012 - 11:09) В качестве фиктивных переменных обычно используются дихотомические переменные, которые принимают всего два значения ?0? и ?1?, например, значение ?0? - ж и ?1? м для переменной пол. В этом случае ничего создавать не нужно, они вводятся в уравнение именно в таком виде, что облегчает трактовку коэффициентов, но называться могут ?фиктивные?. Если градаций больше двух, то в регрессионную модель вводят k-1 бинарных переменных. Давняя беда науки - небрежность в терминологии. То, что Вы закодировали в данном случае значениями 0 и 1, на самом деле является не "полом", а "наличием мужских вторичных половых признаков". Если вы введете еще один признак - "наличие женских вторичных половых признаков", то в даже в этом случае совокупность этих признаков не будет полом. Возможно, в некоторых случаях можно поступить, как поступаете Вы (с поправкой на терминологию), но ошибка может подкрасться незаметно при проведении других видов анализа, например, если потребуется делать классификацию и, соответственно, вычислять расстояния между объектами и классами. Впрочем, ошибки такго рода допускают в публикациях даже известные профессора (не буду поминать его здесьь). Сообщение отредактировал Игорь - 14.01.2012 - 19:36 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!

Сообщений в этой теме

lab_owl Вопрос по логистической регрессии 26.02.2009 - 20:00

плав Цитата(lab_owl @ 26.02.2009 - 20:00)... 26.02.2009 - 21:48

lab_owl Спасибо большое за ответ! Если можно, еще один... 27.02.2009 - 14:49

плав Цитата(lab_owl @ 27.02.2009 - 14:49)... 27.02.2009 - 17:34

lab_owl Спасибо большое! Очень приятно что в рунете ес... 28.02.2009 - 00:00

lab_owl Здравствуйте, Я опять к Вам с вопросами. Получилас... 11.03.2009 - 06:05

плав На самом деле должны интересовать расчитанные при ... 11.03.2009 - 10:30

lab_owl Большое спасибо за ответы! Единственное, я не ... 11.03.2009 - 19:29

плав Цитата(lab_owl @ 11.03.2009 - 19:29)... 11.03.2009 - 22:24

lab_owl Спасибо! 1) Т.е. алгоритм, насколько я понимаю... 12.03.2009 - 08:19

плав Цитата(lab_owl @ 12.03.2009 - 08:19)... 13.03.2009 - 00:11

lab_owl Видимо, из-за моего неполного понимания матчасти п... 13.03.2009 - 00:24

плав Цитата(lab_owl @ 13.03.2009 - 00:24)... 13.03.2009 - 19:11

lab_owl Спасибо огромное! Под R подразумевается вот эт... 15.03.2009 - 03:58

Igoroshka Цитата(lab_owl @ 15.03.2009 - 02:58)... 15.03.2009 - 14:51

Gewissta привет профессионалам статистики! хочу спросит... 14.12.2011 - 16:53

Игорь Цитата(Gewissta @ 14.12.2011 - 17:53... 14.12.2011 - 19:29

Gewissta Цитата(Игорь @ 14.12.2011 - 20:29) Н... 14.12.2011 - 22:43

p2004r Цитата(Gewissta @ 14.12.2011 - 22:43... 14.12.2011 - 23:25

Gewissta Цитата(p2004r @ 15.12.2011 - 00:25) ... 15.12.2011 - 13:51

p2004r Цитата(Gewissta @ 15.12.2011 - 13:51... 15.12.2011 - 14:56

Игорь Цитата(Gewissta @ 14.12.2011 - 23:43... 17.12.2011 - 09:24

Gewissta Цитата(Игорь @ 17.12.2011 - 10:24) И... 17.12.2011 - 19:35

Игорь Цитата(Gewissta @ 17.12.2011 - 20:35... 18.12.2011 - 10:45

Gewissta Цитата(Игорь @ 14.12.2011 - 20:29) Н... 16.12.2011 - 20:49

Olga_ Цитата(Gewissta @ 14.12.2011 - 14:53... 4.01.2012 - 18:34

Вале а Цитата(Olga_ @ 4.01.2012 - 19:34) До... 9.01.2012 - 16:00

Игорь Цитата(Вале а @ 9.01.2012 - 16:00) д... 9.01.2012 - 16:39

Вале а Цитата(Игорь @ 9.01.2012 - 17:39) Пр... 10.01.2012 - 14:36

DrgLena Цитата(Gewissta @ 14.12.2011 - 23:43... 17.12.2011 - 19:51

Gewissta Цитата(DrgLena @ 17.12.2011 - 20:51)... 18.12.2011 - 20:22

100$ Цитата(Gewissta @ 18.12.2011 - 20:22... 18.12.2011 - 20:59

Gewissta Цитата(100$ @ 18.12.2011 - 21:5... 18.12.2011 - 21:16

100$ Цитата(Gewissta @ 18.12.2011 - 21:16... 18.12.2011 - 21:40

Gewissta Цитата(100$ @ 18.12.2011 - 22:4... 18.12.2011 - 21:58

100$ Цитата(Gewissta @ 18.12.2011 - 21:58... 18.12.2011 - 22:30

Игорь Цитата(Gewissta @ 18.12.2011 - 22:58... 19.12.2011 - 15:14

Gewissta Цитата(Игорь @ 19.12.2011 - 15:14) О... 19.12.2011 - 18:16

DrgLena Не обязательно так реагировать на чьи то ошибки. О... 19.12.2011 - 21:02

Игорь Цитата(DrgLena @ 19.12.2011 - 21:02)... 20.12.2011 - 06:02

DrgLena Игорь, вы изложили известные факты, мы это уже обс... 20.12.2011 - 12:46

100$ Цитата... а может называться и Kolmogorov-Smirnov-... 20.12.2011 - 17:16

Игорь Цитата(DrgLena @ 20.12.2011 - 13:46)... 20.12.2011 - 17:28

Gewissta Цитата(Игорь @ 20.12.2011 - 18:28) В... 20.12.2011 - 19:08

Gewissta Добрый день! Строю в SPSS модель лог регрессии... 28.12.2011 - 16:27

p2004r Цитата(Gewissta @ 28.12.2011 - 16:27... 28.12.2011 - 20:34

p2004r Цитата(Gewissta @ 28.12.2011 - 16:27... 28.12.2011 - 20:40

Gewissta Цитата(p2004r @ 28.12.2011 - 21:40) ... 28.12.2011 - 21:05

DrgLena Цитата(Игорь @ 9.01.2012 - 17:39) Пр... 9.01.2012 - 19:08

Игорь Цитата(DrgLena @ 9.01.2012 - 19:08) ... 9.01.2012 - 20:15

DrgLena Я не спорю с вами в отношении числа градаций в пер... 9.01.2012 - 21:46

Игорь Цитата(DrgLena @ 9.01.2012 - 22:46) ... 10.01.2012 - 19:54

Вале а еще интересует, какие предположения могут быть выд... 10.01.2012 - 16:19

DrgLena Цитата(Игорь @ 10.01.2012 - 20:54) s... 11.01.2012 - 11:09

Игорь Цитата(DrgLena @ 11.01.2012 - 11:09)... 13.01.2012 - 05:39

DrgLena Цитата(Игорь @ 13.01.2012 - 05:39) .... 13.01.2012 - 10:56

Игорь Цитата(DrgLena @ 13.01.2012 - 10:56)... 13.01.2012 - 15:58

Вале а Цитата(Игорь @ 13.01.2012 - 16:58) д... 13.01.2012 - 21:43

DrgLena А в этой ветке форума пол (sex) всего лишь имя пер... 13.01.2012 - 11:28

DrgLena Прежде, чем вы уйдете, громко хлопнув дверью, сове... 13.01.2012 - 18:03

Stefa Здравствуйте, Игорь, не уходите, пожалуйста, с фор... 16.01.2012 - 05:22

Вале а Цитата(Stefa @ 16.01.2012 - 06:22) З... 16.01.2012 - 18:34

Вале а замерла веточка 7.02.2012 - 14:09

« Предыдущая тема · Медицинская статистика · Следующая тема »