Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Шкала по модели логистической регрессии
Tatyana_
сообщение 4.05.2007 - 09:21
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 4.05.2007
Пользователь №: 4082



Здравствуйте! Подскажите, пожалуйста, как, имея построенную модель логистической регрессии, построить шкалу разбивки пациентов на группы относительно риска наличия заболевания? Например, у меня есть признаки: индекс массы тела, возраст, наличие камней и т.д. Данные бинарные и непрерывные. По этим данным получила модель, которая позволяет классифицировать пациентов, но хотелось бы для каждого нового пациента не подставлять конкретные значения в уравнение логистической регрессии, а просто смотреть, ага возраст от 18 до 30, приписываем пациенту 3 балла, > 60 - 6 баллов, и так по каждому признаку. А потом по полученной сумме баллов определять риск наличия заболевания.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
плав
сообщение 9.05.2007 - 13:13
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



1) Подставляя значения в приведенную формулу Вы получаете не вероятности наличия заболевания а некую величину, ей пропорциональную. Соответственно, используя эту формулу Вы можете только сделать шкалу классификации (т.е. пациент скорее всего боле, пациент, скорее всего, здоров). Если это Вас устраивает, сделайте вначала шкалу, как Вы описали в первом посте (т.е. перекодируйте возраст, пол, размеры печени, индекс массы тела в баллы). Затем сделайте логистическую регрессию - полученные коэффициенты умножьте на значения баллов и получите нужные значения, которые можно суммировать (т.е. коэффициент для возраста 40-49 а=2, баллы для этой группы Вы сделали 1, соответственно для возраста 40-49 - прибавить 2*1 = 2 балла). Далее надо найти точку разделения (какая дает наилучшее разделение одной и другой групп и для нее определить пограничное значение баллов). Например, точка разделения была y=0,5. Соответственно, пограничное значение ln(1/y-1)=0. Однако, подобная шкала потребует добавления постоянного количества баллов после расчетов (а0). Если а0=1, то пограничное значение будет равно 1 (обратите только внимание на знаки, я исходил из формулы, написанной Вами, ряд программ не вставляют автоматом минус перед скобкой в выражении (а0+а1*х1+...)). Тогда, если сумма больше 1, пациент скорее здоров, если меньше - скорее болен.
2) если нужна именно вероятность - надо делать пуассоновскую регрессию. Подготовка данных примерно та же, что и в случае логистической. однако надо иметь по одной переменной для каждой группы (т.е. age40 - для возраста 40-49 лет, age50 для 50-59 и т.д. Все переменные будут иметь значения 0 или 1). Детали по использованию регрессии в разных системах http://www.indiana.edu/~statmath/stat/all/count/count2.html, обсуждение сравнения разных методов http://www.biomedcentral.com/1471-2288/3/21. Хорошие примеры того, как рассчитать относительные риски с помощью SAS приведены в статье http://aje.oxfordjournals.org/cgi/content/full/162/3/199 (или тут http://www.ats.ucla.edu/STAT/SAS/faq/relative_risk.htm). Зная RR можно легко оценить вероятность наличия заболевания в любой группе, если известна распространенность в контроле (исходной группе). На самом деле, постоянный член уравнения (intercept) в модели и есть распространенность (точнее распространенность - вероятность наличия заболевания - равна exp(intercept)) в нулевой группе.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Tatyana_
сообщение 9.05.2007 - 22:37
Сообщение #3





Группа: Пользователи
Сообщений: 4
Регистрация: 4.05.2007
Пользователь №: 4082



Спасибо большое!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему