Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

5 страниц V  « < 2 3 4 5 >  
Добавить ответ в эту темуОткрыть тему
> Вопрос по логистической регрессии
Вале а
сообщение 9.01.2012 - 16:00
Сообщение #46





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408



Цитата(Olga_ @ 4.01.2012 - 19:34) *
Доброго всем дня.

Вижу, что вы запутались.
Логистическая регрессия используется для анализа бинарых данных, например, ВИЧ статус +/-, анемия да/нет и т.д. Бинарные данные имеют Бернулли распределение, которое еквивалентно биномиальному распределению Bn(n, p) , c n=1.
Поетому никакое определение нормальности распределения не требуется.

Определение нормально ли распределены данные необходимо, когда вы анализируете числовые/continuous переменные (АД, уровень холестерина, ФВД..)


доброго дня! нет не запутался, с зависимой переменной все ясно, там по определению нормального распр. не может быть. А от как быть с распределением значений предикторов? Авторы SPSS'овского tutorial'а утверждают, что если предикторы подчиняются многомерному норм. распределению, то модель будет более стабильной
Assumptions. Logistic regression does not rely on distributional assumptions in the same sense that discriminant analysis does. However, your solution may be more stable if your predictors have a multivariate normal distribution. Additionally, as with other forms of regression, multicollinearity among the predictors can lead to biased estimates and inflated standard errors. The procedure is most effective when group membership is a truly categorical variable; if group membership is based on values of a continuous variable (for example, "high IQ" versus "low IQ"), you should consider using linear regression to take advantage of the richer information offered by the continuous variable itself.

p.s. зашел с другого ника
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 9.01.2012 - 16:39
Сообщение #47





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Вале а @ 9.01.2012 - 16:00) *
доброго дня! нет не запутался, с зависимой переменной все ясно, там по определению нормального распр. не может быть. А от как быть с распределением значений предикторов? Авторы SPSS'овского tutorial'а утверждают, что если предикторы подчиняются многомерному норм. распределению, то модель будет более стабильной

Предикторы могут быть любыми, а не только интервальными количественными. Соответственно, требовать от них согласия с каким-либо типом распределения не следует. Однако, если применяются бинарные предикторы, просто взять и подставить, скажем 0 для нижнего значения и 1 для верхнего будет неверным. В данном случае необходимо использовать фиктивные (dummy) переменные. Подробности см. на с. 32 книги "Hosmer D.W., Lemeshow S. Applied logistic regression. - New York, NY: John Wiley & Sons, 2000". Да и вообще, имеет смысл посмотреть эту (и, возможно, только эту) книгу, если вы решили изучить логистическую регрессию.

Если нужно быстро, вот тут серия статей:
1 часть http://www.basegroup.ru/library/analysis/r...ssion/logistic/
2 часть http://www.basegroup.ru/library/practice/l..._medic_scoring/

Сообщение отредактировал Игорь - 9.01.2012 - 16:44


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 9.01.2012 - 19:08
Сообщение #48





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(Игорь @ 9.01.2012 - 17:39) *
Предикторы могут быть любыми, а не только интервальными количественными. Соответственно, требовать от них согласия с каким-либо типом распределения не следует. Однако, если применяются бинарные предикторы, просто взять и подставить, скажем 0 для нижнего значения и 1 для верхнего будет неверным.

Нет, бинарные, они на то и бинарные, а это значит либо есть, тогда коэффициент умножается на "1", либо нет, и не на что умножать! Читайте указанную страницу внимательней, - дискретные, номинальние и др. Но расса - не бинарная, может быть не только черная и белая, и пол, как известно, также может быть и не "м" и не "ж", тогда и кодируйте, как указано в примере на той же странице.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 9.01.2012 - 20:15
Сообщение #49





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(DrgLena @ 9.01.2012 - 19:08) *
Нет, бинарные, они на то и бинарные, а это значит либо есть, тогда коэффициент умножается на "1", либо нет, и не на что умножать! Читайте указанную страницу внимательней, - дискретные, номинальние и др. Но расса - не бинарная, может быть не только черная и белая

Вы совершенно правы. Только замечание это немного уводит от темы (это я зря данный вопрос здесь затронул), но неважно. А важно, что предикторы могут быть любыми.
Цитата(DrgLena @ 9.01.2012 - 19:08) *
... пол, как известно, также может быть и не "м" и не "ж", тогда и кодируйте, как указано в примере на той же странице.

Кому известно? Мне известно, что пол может быть только "м" или "ж". О чем сказано в любом учебнике, и в любой энциклопедии. Хотя бы здесь http://www.medpulse.ru/encyclopedia/427.html.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 9.01.2012 - 21:46
Сообщение #50





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Я не спорю с вами в отношении числа градаций в переменной пол (sex, биологическая характеристика) или гендер (социально-психологический атрибут) где выделяется смешанная категория, имеющая общие признаки ?гермафродит? в переменной пол и гермафродитный в переменной гендер. Именно поэтому, на указанной странице sex перечислен вместе с расой, как нуждающийся в создании дополнительно переменной для логистической регрессии. Но вы правы ? это спор для других форумов.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Вале а
сообщение 10.01.2012 - 14:36
Сообщение #51





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408



Цитата(Игорь @ 9.01.2012 - 17:39) *
Предикторы могут быть любыми, а не только интервальными количественными. Соответственно, требовать от них согласия с каким-либо типом распределения не следует. Однако, если применяются бинарные предикторы, просто взять и подставить, скажем 0 для нижнего значения и 1 для верхнего будет неверным. В данном случае необходимо использовать фиктивные (dummy) переменные. Подробности см. на с. 32 книги "Hosmer D.W., Lemeshow S. Applied logistic regression. - New York, NY: John Wiley & Sons, 2000". Да и вообще, имеет смысл посмотреть эту (и, возможно, только эту) книгу, если вы решили изучить логистическую регрессию.

Если нужно быстро, вот тут серия статей:
1 часть http://www.basegroup.ru/library/analysis/r...ssion/logistic/
2 часть http://www.basegroup.ru/library/practice/l..._medic_scoring/


спасибо. да книга Хосмера-Лемешева настольная
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Вале а
сообщение 10.01.2012 - 16:19
Сообщение #52





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408



еще интересует, какие предположения могут быть выдвинуты для остатков в рамках логистической регрессии (для построения достоверной, стабильной модели)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 10.01.2012 - 19:54
Сообщение #53





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(DrgLena @ 9.01.2012 - 22:46) *
Я не спорю с вами в отношении числа градаций в переменной пол (sex, биологическая характеристика) или гендер (социально-психологический атрибут) где выделяется смешанная категория, имеющая общие признаки ?гермафродит? в переменной пол и гермафродитный в переменной гендер. Именно поэтому, на указанной странице sex перечислен вместе с расой, как нуждающийся в создании дополнительно переменной для логистической регрессии. Но вы правы ? это спор для других форумов.

Для начала, гермафродит - не пол и не гендер, а заболевание. См. МКБ-10 http://mkb10.com/Q99.1 Если требуется изучить влияние других признаков, то и нужно вводить в модель эти признаки (например, имеющие отношение к теме физические, психические и т.д.), а не нагружать несвойственными функциями другие общепринятые признаки.

Полагаю, что признак sex перечислен вместе с расой потому, что sex - не бинарный признак, а номинальный с двумя градациями (и гермафродит, а также другие врожденные, приобретенные и психические отклонения тут не при чем), поэтому для него также требуется в логистической модели вводить фиктивные (dummy) переменные. Конечно, в каких-то опросниках можно закодировать пол как 0 и 1, но применение данных чисел в расчетах приведет к ошибке - признаки для расчетов необходимо перекодировать в dummy переменные.

Кстати, о расе. Представляется, что точнее будет говорить о других признаках, характеризующих расу, а не только, скажем цвет кожи, разрез глаз, форма черепа, наличие эпикантуса и т.п. Возможно, здесь нужно говорить исключительно о гаплогруппах, а вовсе не о вторичных признаках. Т.е. расу, как признак, я бы вообще исключил из рассмотрения, как совершенно неинформативный. Хотя для иллюстрации метода пример сгодится.

Цитата(Вале а @ 10.01.2012 - 17:19) *
еще интересует, какие предположения могут быть выдвинуты для остатков в рамках логистической регрессии (для построения достоверной, стабильной модели)

Думаю, не нужно "заморачиваться" относительно остатков. "Достоверность" логистической модели, как Вы выразились, принято оценивать ROC анализом, понимая под качеством модели ее приемлемую разрешающую, предсказывающую способность. В двух ссылках, которые я приводил выше, об этом наглядно рассказано.

Сообщение отредактировал Игорь - 10.01.2012 - 19:57


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 11.01.2012 - 11:09
Сообщение #54





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(Игорь @ 10.01.2012 - 20:54) *
sex - не бинарный признак, а номинальный с двумя градациями (и гермафродит, а также другие врожденные, приобретенные и психические отклонения тут не при чем), поэтому для него также требуется в логистической модели вводить фиктивные (dummy) переменные. Конечно, в каких-то опросниках можно закодировать пол как 0 и 1, но применение данных чисел в расчетах приведет к ошибке - признаки для расчетов необходимо перекодировать в dummy переменные.

http://www.hse.ru/data/2011/11/30/12711271...ution_Dummy.pdf

Фиктивные переменные в отечественной литературе имеют термин структурных переменных и они вводятся не только в логистические модели. В качестве фиктивных переменных обычно используются дихотомические переменные, которые принимают всего два значения ?0? и ?1?, например, значение ?0? - ж и ?1? м для переменной пол. В этом случае ничего создавать не нужно, они вводятся в уравнение именно в таком виде, что облегчает трактовку коэффициентов, но называться могут ?фиктивные?. Если градаций больше двух, то в регрессионную модель вводят k-1 бинарных переменных.
?Фиктивные переменные? - это не совсем удачный перевод dummy var поскольку они вовсе не фиктивные, их фиктивность лишь в том, что они количественным образом описывают качественный признак.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 13.01.2012 - 05:39
Сообщение #55





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(DrgLena @ 11.01.2012 - 11:09) *
В качестве фиктивных переменных обычно используются дихотомические переменные, которые принимают всего два значения ?0? и ?1?, например, значение ?0? - ж и ?1? м для переменной пол. В этом случае ничего создавать не нужно, они вводятся в уравнение именно в таком виде, что облегчает трактовку коэффициентов, но называться могут ?фиктивные?. Если градаций больше двух, то в регрессионную модель вводят k-1 бинарных переменных.

Давняя беда науки - небрежность в терминологии. То, что Вы закодировали в данном случае значениями 0 и 1, на самом деле является не "полом", а "наличием мужских вторичных половых признаков". Если вы введете еще один признак - "наличие женских вторичных половых признаков", то в даже в этом случае совокупность этих признаков не будет полом.

Возможно, в некоторых случаях можно поступить, как поступаете Вы (с поправкой на терминологию), но ошибка может подкрасться незаметно при проведении других видов анализа, например, если потребуется делать классификацию и, соответственно, вычислять расстояния между объектами и классами. Впрочем, ошибки такго рода допускают в публикациях даже известные профессора (не буду поминать его здесьь).

Сообщение отредактировал Игорь - 14.01.2012 - 19:36


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 13.01.2012 - 10:56
Сообщение #56





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(Игорь @ 13.01.2012 - 05:39) *
... позволит в расчетах учесть наличие так любимых Вами гермафродитов...

Довольно хамский вывод из моей цитаты.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 13.01.2012 - 11:28
Сообщение #57





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



А в этой ветке форума пол (sex) всего лишь имя переменной, а не научное понятие, требующее точного определения.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 13.01.2012 - 15:58
Сообщение #58





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(DrgLena @ 13.01.2012 - 10:56) *
Довольно хамский вывод из моей цитаты.

Нет, это переходит все границы приличий. Один в личке предлагает с малолетними девочками пообщаться, другой из виднейших советских ученых педерастов делает, третий в МКБ путается. Короче, не желая видеть превращения форума в телеканал ТНТ, покидаю его. Счастливо оставаться. Читайте книжки.

Сообщение отредактировал Игорь - 15.01.2012 - 12:52


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 13.01.2012 - 18:03
Сообщение #59





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Прежде, чем вы уйдете, громко хлопнув дверью, советую Вам удалить Ваш вывод о том, как я отношусь к третьей категории переменной sex, вы явно перешли на личности, а это не личная переписка. И Ваши комментарии о сексуальной ориентации уважаемого ученого также уберите, они не были высказаны на форуме в столь грубой форме. А отдохнув у ТНТ, возвращайтесь, почитав книжки о культуре дискуссии. Со своей стороны обязуюсь удалить свою гневную реакцию.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Вале а
сообщение 13.01.2012 - 21:43
Сообщение #60





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408



Цитата(Игорь @ 13.01.2012 - 16:58) *
другой из виднейших советских ученых педерастов делает


давайте быть корректными, и называть их геями, их талант ориентация не умаляет.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

5 страниц V  « < 2 3 4 5 >
Добавить ответ в эту темуОткрыть тему