Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Вопрос по логистической регрессии
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Страницы: 1, 2
Вале а
Цитата(Игорь @ 9.01.2012 - 17:39) *
Предикторы могут быть любыми, а не только интервальными количественными. Соответственно, требовать от них согласия с каким-либо типом распределения не следует. Однако, если применяются бинарные предикторы, просто взять и подставить, скажем 0 для нижнего значения и 1 для верхнего будет неверным. В данном случае необходимо использовать фиктивные (dummy) переменные. Подробности см. на с. 32 книги "Hosmer D.W., Lemeshow S. Applied logistic regression. - New York, NY: John Wiley & Sons, 2000". Да и вообще, имеет смысл посмотреть эту (и, возможно, только эту) книгу, если вы решили изучить логистическую регрессию.

Если нужно быстро, вот тут серия статей:
1 часть http://www.basegroup.ru/library/analysis/r...ssion/logistic/
2 часть http://www.basegroup.ru/library/practice/l..._medic_scoring/


спасибо. да книга Хосмера-Лемешева настольная
Вале а
еще интересует, какие предположения могут быть выдвинуты для остатков в рамках логистической регрессии (для построения достоверной, стабильной модели)
Игорь
Цитата(DrgLena @ 9.01.2012 - 22:46) *
Я не спорю с вами в отношении числа градаций в переменной пол (sex, биологическая характеристика) или гендер (социально-психологический атрибут) где выделяется смешанная категория, имеющая общие признаки ?гермафродит? в переменной пол и гермафродитный в переменной гендер. Именно поэтому, на указанной странице sex перечислен вместе с расой, как нуждающийся в создании дополнительно переменной для логистической регрессии. Но вы правы ? это спор для других форумов.

Для начала, гермафродит - не пол и не гендер, а заболевание. См. МКБ-10 http://mkb10.com/Q99.1 Если требуется изучить влияние других признаков, то и нужно вводить в модель эти признаки (например, имеющие отношение к теме физические, психические и т.д.), а не нагружать несвойственными функциями другие общепринятые признаки.

Полагаю, что признак sex перечислен вместе с расой потому, что sex - не бинарный признак, а номинальный с двумя градациями (и гермафродит, а также другие врожденные, приобретенные и психические отклонения тут не при чем), поэтому для него также требуется в логистической модели вводить фиктивные (dummy) переменные. Конечно, в каких-то опросниках можно закодировать пол как 0 и 1, но применение данных чисел в расчетах приведет к ошибке - признаки для расчетов необходимо перекодировать в dummy переменные.

Кстати, о расе. Представляется, что точнее будет говорить о других признаках, характеризующих расу, а не только, скажем цвет кожи, разрез глаз, форма черепа, наличие эпикантуса и т.п. Возможно, здесь нужно говорить исключительно о гаплогруппах, а вовсе не о вторичных признаках. Т.е. расу, как признак, я бы вообще исключил из рассмотрения, как совершенно неинформативный. Хотя для иллюстрации метода пример сгодится.

Цитата(Вале а @ 10.01.2012 - 17:19) *
еще интересует, какие предположения могут быть выдвинуты для остатков в рамках логистической регрессии (для построения достоверной, стабильной модели)

Думаю, не нужно "заморачиваться" относительно остатков. "Достоверность" логистической модели, как Вы выразились, принято оценивать ROC анализом, понимая под качеством модели ее приемлемую разрешающую, предсказывающую способность. В двух ссылках, которые я приводил выше, об этом наглядно рассказано.
DrgLena
Цитата(Игорь @ 10.01.2012 - 20:54) *
sex - не бинарный признак, а номинальный с двумя градациями (и гермафродит, а также другие врожденные, приобретенные и психические отклонения тут не при чем), поэтому для него также требуется в логистической модели вводить фиктивные (dummy) переменные. Конечно, в каких-то опросниках можно закодировать пол как 0 и 1, но применение данных чисел в расчетах приведет к ошибке - признаки для расчетов необходимо перекодировать в dummy переменные.

http://www.hse.ru/data/2011/11/30/12711271...ution_Dummy.pdf

Фиктивные переменные в отечественной литературе имеют термин структурных переменных и они вводятся не только в логистические модели. В качестве фиктивных переменных обычно используются дихотомические переменные, которые принимают всего два значения ?0? и ?1?, например, значение ?0? - ж и ?1? м для переменной пол. В этом случае ничего создавать не нужно, они вводятся в уравнение именно в таком виде, что облегчает трактовку коэффициентов, но называться могут ?фиктивные?. Если градаций больше двух, то в регрессионную модель вводят k-1 бинарных переменных.
?Фиктивные переменные? - это не совсем удачный перевод dummy var поскольку они вовсе не фиктивные, их фиктивность лишь в том, что они количественным образом описывают качественный признак.
Игорь
Цитата(DrgLena @ 11.01.2012 - 11:09) *
В качестве фиктивных переменных обычно используются дихотомические переменные, которые принимают всего два значения ?0? и ?1?, например, значение ?0? - ж и ?1? м для переменной пол. В этом случае ничего создавать не нужно, они вводятся в уравнение именно в таком виде, что облегчает трактовку коэффициентов, но называться могут ?фиктивные?. Если градаций больше двух, то в регрессионную модель вводят k-1 бинарных переменных.

Давняя беда науки - небрежность в терминологии. То, что Вы закодировали в данном случае значениями 0 и 1, на самом деле является не "полом", а "наличием мужских вторичных половых признаков". Если вы введете еще один признак - "наличие женских вторичных половых признаков", то в даже в этом случае совокупность этих признаков не будет полом.

Возможно, в некоторых случаях можно поступить, как поступаете Вы (с поправкой на терминологию), но ошибка может подкрасться незаметно при проведении других видов анализа, например, если потребуется делать классификацию и, соответственно, вычислять расстояния между объектами и классами. Впрочем, ошибки такго рода допускают в публикациях даже известные профессора (не буду поминать его здесьь).
DrgLena
Цитата(Игорь @ 13.01.2012 - 05:39) *
... позволит в расчетах учесть наличие так любимых Вами гермафродитов...

Довольно хамский вывод из моей цитаты.
DrgLena
А в этой ветке форума пол (sex) всего лишь имя переменной, а не научное понятие, требующее точного определения.
Игорь
Цитата(DrgLena @ 13.01.2012 - 10:56) *
Довольно хамский вывод из моей цитаты.

Нет, это переходит все границы приличий. Один в личке предлагает с малолетними девочками пообщаться, другой из виднейших советских ученых педерастов делает, третий в МКБ путается. Короче, не желая видеть превращения форума в телеканал ТНТ, покидаю его. Счастливо оставаться. Читайте книжки.
DrgLena
Прежде, чем вы уйдете, громко хлопнув дверью, советую Вам удалить Ваш вывод о том, как я отношусь к третьей категории переменной sex, вы явно перешли на личности, а это не личная переписка. И Ваши комментарии о сексуальной ориентации уважаемого ученого также уберите, они не были высказаны на форуме в столь грубой форме. А отдохнув у ТНТ, возвращайтесь, почитав книжки о культуре дискуссии. Со своей стороны обязуюсь удалить свою гневную реакцию.
Вале а
Цитата(Игорь @ 13.01.2012 - 16:58) *
другой из виднейших советских ученых педерастов делает


давайте быть корректными, и называть их геями, их талант ориентация не умаляет.
Stefa
Здравствуйте, Игорь, не уходите, пожалуйста, с форума, Ваши ответы на поставленные вопросы очень профессиональные и при этом понятные, будет очень жалко, если Вы перестанет помогать. Просто не обращайте внимания на всё это
Вале а
Цитата(Stefa @ 16.01.2012 - 06:22) *
Здравствуйте, Игорь, не уходите, пожалуйста, с форума, Ваши ответы на поставленные вопросы очень профессиональные и при этом понятные, будет очень жалко, если Вы перестанет помогать. Просто не обращайте внимания на всё это


я присоединяюсь к просьбе
Вале а
замерла веточка
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.