![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 19.10.2008 Пользователь №: 5416 ![]() |
Здравствуйте!
Извините за возможно глупый вопрос, но мне очень нужна помощь, может кто сталкивался как можно в программе Statistica рассчитать прогнозирование риска развития рецидивов заболевания, если известны пол, возраст, избыточная масса тела, и еще три признака(у части пациентов имеется или отсутствуют), всего пациентов 60, из них 20 мужчины, остальные женщины. При чем как рабочая гипотеза - что риск заболевания чаще всего у женщин, возраст старше 40 и с избыточной массой тела? Заранее спасибо за помощь! |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 19.10.2008 Пользователь №: 5416 ![]() |
Большое спасибо за замечания! Извините, что опять испытываю ваше терпение. В одной из тем на форуме про логистическую регрессию очень полезный совет
Если в модели используются порядковые независимые переменные, не бинарные, например степень выраженности чего либо (1 - нет, 2-слабая, 3- сльная). Зависимая - бинарная, как полагается ( 1 -есть болезнь, 0 -нет), то как интерпретировать результаты? Как правильно оценить риск развития заболевания от этого фактора? Надо делать так: вместо одной переменной с тремя уровнями сделать две бинарных переменных. Например - Exist (0 - нет, 1- да) и Severity (0- нет или слабая, 1 - сильная). Тогда Вы полностью описываете свою классификацию: Exist Severity нет 0 0 слабая 1 0 сильная 1 1 Получаете два отношения шансов. Первое показывает во сколько раз наличие чего-то увеличивает шансы наличия заболевания, второе - во сколько раз сильное воздействие увеличивает шансы наличия заболевания по сравнению с отсутствием/слабым воздействием. Произведение отношения шансов - во сколько раз риск при сильной выраженности больше, чем при отсутствии и т.д. Если изменить вид представления признаков (например,денситометрия) и представить как два фактора, как советует автор, то получается модель -значимость 0.000, правильно предсказанных 87%, Sp=80,6% , Se=92,1% , TPR =92,1%, FPR = 19,3 % (логистическая регрессия, метод Backward LR) и получаются значимости факторов из.масса - 0.007 денсит(налич) - 0.003 степень_ден(силь) - 0.003 возраст(старше 46) -0.098 и уравнение Y=-26.600 + 0.959X1 - 5.139X2 + 6.869X3 + 2.767X4 И вот эти два фактора представлять в уравнении как произведение? или отдельно как вот написано? |
|
![]() |
![]() |
![]() ![]() |