Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V  < 1 2  
Добавить ответ в эту темуОткрыть тему
> Логистическая регрессия, интерпретация коэффициентов
Игорь
сообщение 21.05.2009 - 11:09
Сообщение #16





Группа: Пользователи
Сообщений: 1141
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Мария Александровна @ 21.05.2009 - 11:50) *
ЗДРАвствуйте! После просмотра сайта окнчательно запуталась. Необходимо построить логит-модель, завис. переменная - исход(0-неуд. 1-уд), независ. количественные - возраст, лейкоцитоз, ЛИИ, качественные номинальные - вид заболевания (4 вида по степени выраженности не классифицир, т.е. не категориальные) и вид лечения (4 вида), а так же пол, тяжесть состояния - 3 категории. Я поняла, что для категориальных надо делать пустышки, а для видов заболевания и лечения тоже? В мою задачу входит из вышеперечисленных выбрать наиболее значимые предикторы и соответственно построить приемлемую модель. Раньше я строила в быстрой логит регрессии, но видимо необходимо в GLM пошаговую с исключением. Там попробовала не перекодируя данных, выдает слишком много переменных. Как быть? Извините за дилетантские вопросы.

Не пустышки, а dummy. По-русски - фиктивные (индикаторные) переменные. Из одной номинальной переменной с N градациями получается N фиктивных переменных с двумя градациями (0 или 1) каждая. Категориальные - это номинальные с двумя градациями (0 или 1). Фиктивные переменные можно использовать в регрессионном анализе.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 21.05.2009 - 17:46
Сообщение #17





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Мария Александровна @ 21.05.2009 - 11:50) *
ЗДРАвствуйте! После просмотра сайта окнчательно запуталась. Необходимо построить логит-модель, завис. переменная - исход(0-неуд. 1-уд), независ. количественные - возраст, лейкоцитоз, ЛИИ, качественные номинальные - вид заболевания (4 вида по степени выраженности не классифицир, т.е. не категориальные) и вид лечения (4 вида), а так же пол, тяжесть состояния - 3 категории. Я поняла, что для категориальных надо делать пустышки, а для видов заболевания и лечения тоже? В мою задачу входит из вышеперечисленных выбрать наиболее значимые предикторы и соответственно построить приемлемую модель. Раньше я строила в быстрой логит регрессии, но видимо необходимо в GLM пошаговую с исключением. Там попробовала не перекодируя данных, выдает слишком много переменных. Как быть? Извините за дилетантские вопросы.

Не совсем понятно про GLM. Вы в какой программе работаете? Дело в том, что, например в SAS GLM это линейная модель с допущением нормальности распределения ошибки, т.е. ANCOVA - линейная регрессия, а в R - это действительно GLM (т.е. позволяет разные распределения ошибок). Для Вашей задачи нужна логистическая регрессия (похоже, что логит - термин из STATISTICA), но проавильно замечено, все качесвтенные переменные надо перекодировать. Иными словами у Вас будет 3 переменных на тип заболевания, 3 - на вид лечения и 2 - на тяжесть состояния (при перекодировке делается на одну переменную меньше, чем уровней). Без перекодировки никак нельзя-с.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Мария Александро...
сообщение 21.05.2009 - 21:27
Сообщение #18





Группа: Пользователи
Сообщений: 14
Регистрация: 1.03.2009
Пользователь №: 5873



Спасибо! Да это действительно Statistica 6, и я пытаюсь построить логистическую регрессию. Насчет перекодировки, почему 3? Например вид заболевания: фибриноторакс - 1-есть, 0-нет, пневмоторакс - 1-есть, 0-нет, плеврит - 1-есть, 0-нет, пиоторакс 1-есть, 0-нет, получается 4, или я неправильно поняла? Сразу следующий вопрос: Если из перекодированных переменных например фибриноторакс будет значимым предиктором в модели, а остальные нет, получится что другие виды заболевания отбросятся и не влияют на исход заболевания, никак не учитываются? Признательна за помощь.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 22.05.2009 - 19:09
Сообщение #19





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Мария Александровна @ 21.05.2009 - 22:27) *
Спасибо! Да это действительно Statistica 6, и я пытаюсь построить логистическую регрессию. Насчет перекодировки, почему 3? Например вид заболевания: фибриноторакс - 1-есть, 0-нет, пневмоторакс - 1-есть, 0-нет, плеврит - 1-есть, 0-нет, пиоторакс 1-есть, 0-нет, получается 4, или я неправильно поняла? Сразу следующий вопрос: Если из перекодированных переменных например фибриноторакс будет значимым предиктором в модели, а остальные нет, получится что другие виды заболевания отбросятся и не влияют на исход заболевания, никак не учитываются? Признательна за помощь.

Если ситуация, как у Вас отдельные заболевания, то да, надо четыре, но тогда почему это была общая переменная? П во если у Вас была перменная "заболевание", принимашая значения "фибриноторакс", "плеврит", "пневмоторакс", "пиоторакс" (т.е. обязательно что-то есть), то надо три переменных
фибрноторакс, плеврит, пневмоторакс. Если все три переменных имеют значене 0, то это - значит - пиоторакс, который и является группой сравнения (остальные сравниваются с ним). В случае, если у Вас может е быть ...торакса, то тогда у Вас было 5 значений (четыре состояния и отсуствие чего бы то ни было).
Ответ на второй вопрос - да, на исход влияет только фибриноторакс.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Мария Александро...
сообщение 23.05.2009 - 10:26
Сообщение #20





Группа: Пользователи
Сообщений: 14
Регистрация: 1.03.2009
Пользователь №: 5873



У меня 4 вида заболевания, обязательно есть какое-то из них, только я не поняла что лучше делать 4 или 3 переменных. Если 3 то как определить что лучше взять группой сравнения (кодируется 0 0). Для видов лечения за нулевые надо брать отсутствие хирургического лечения? Для тяжести состояния низшую категорию - удовлетворительное. Я Вас правильно понимаю? Спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 23.05.2009 - 22:38
Сообщение #21





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Мария Александровна @ 23.05.2009 - 11:26) *
У меня 4 вида заболевания, обязательно есть какое-то из них, только я не поняла что лучше делать 4 или 3 переменных. Если 3 то как определить что лучше взять группой сравнения (кодируется 0 0). Для видов лечения за нулевые надо брать отсутствие хирургического лечения? Для тяжести состояния низшую категорию - удовлетворительное. Я Вас правильно понимаю? Спасибо.

Лучше - 3, за исходный уровень брать ту, что считаете группой сравнения - вопрос не ко мне, а к Вам. Аналогично и в отношении лечения (Вы сами должны решить в соответствии с задачами исследования - если задача изучить влияние хирургического лечения, то да, 0 уровень - отсутствие хирургического лечения).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Мария Александро...
сообщение 24.05.2009 - 11:08
Сообщение #22





Группа: Пользователи
Сообщений: 14
Регистрация: 1.03.2009
Пользователь №: 5873



Очень признательна за помощь. Я так и подумала. Спасибо
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V  < 1 2
Добавить ответ в эту темуОткрыть тему