![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 15.08.2007 Пользователь №: 4262 ![]() |
Решила вынести вопрос в новую тему,
в конце чужой темы он оказался для всех незаметным ![]() У меня вопрос по применению логистической регрессии, пожалуйста, подскажите. Если в модели используются порядковые независимые переменные, не бинарные, напрммер степень выраженности чего либо (1 - нет, 2-слабая, 3- сльная). Зависимая - бинарная, как полагается ( 1 -есть болезнь, 0 -нет), то как интерпретировать результаты? Как правильно оценить риск развития заболевания от этого фактора?. Пользуюсь Statistica 6. Расчетная величина OR=3.5. Это как правильно интерпретировать? Когда независимая бинарная понятно. Или нужно все-таки разбивать независимую на несколько бинарных переменных. Подскажите, пожалуйста, кто сталкивался с этим. |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 1.03.2009 Пользователь №: 5873 ![]() |
ЗДРАвствуйте! После просмотра сайта окнчательно запуталась. Необходимо построить логит-модель, завис. переменная - исход(0-неуд. 1-уд), независ. количественные - возраст, лейкоцитоз, ЛИИ, качественные номинальные - вид заболевания (4 вида по степени выраженности не классифицир, т.е. не категориальные) и вид лечения (4 вида), а так же пол, тяжесть состояния - 3 категории. Я поняла, что для категориальных надо делать пустышки, а для видов заболевания и лечения тоже? В мою задачу входит из вышеперечисленных выбрать наиболее значимые предикторы и соответственно построить приемлемую модель. Раньше я строила в быстрой логит регрессии, но видимо необходимо в GLM пошаговую с исключением. Там попробовала не перекодируя данных, выдает слишком много переменных. Как быть? Извините за дилетантские вопросы.
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
ЗДРАвствуйте! После просмотра сайта окнчательно запуталась. Необходимо построить логит-модель, завис. переменная - исход(0-неуд. 1-уд), независ. количественные - возраст, лейкоцитоз, ЛИИ, качественные номинальные - вид заболевания (4 вида по степени выраженности не классифицир, т.е. не категориальные) и вид лечения (4 вида), а так же пол, тяжесть состояния - 3 категории. Я поняла, что для категориальных надо делать пустышки, а для видов заболевания и лечения тоже? В мою задачу входит из вышеперечисленных выбрать наиболее значимые предикторы и соответственно построить приемлемую модель. Раньше я строила в быстрой логит регрессии, но видимо необходимо в GLM пошаговую с исключением. Там попробовала не перекодируя данных, выдает слишком много переменных. Как быть? Извините за дилетантские вопросы. Не совсем понятно про GLM. Вы в какой программе работаете? Дело в том, что, например в SAS GLM это линейная модель с допущением нормальности распределения ошибки, т.е. ANCOVA - линейная регрессия, а в R - это действительно GLM (т.е. позволяет разные распределения ошибок). Для Вашей задачи нужна логистическая регрессия (похоже, что логит - термин из STATISTICA), но проавильно замечено, все качесвтенные переменные надо перекодировать. Иными словами у Вас будет 3 переменных на тип заболевания, 3 - на вид лечения и 2 - на тяжесть состояния (при перекодировке делается на одну переменную меньше, чем уровней). Без перекодировки никак нельзя-с. |
|
![]() |
![]() |
![]() ![]() |