Прогнозирование риска рецидивов, Statistica 6 |
Здравствуйте, гость ( Вход | Регистрация )
Прогнозирование риска рецидивов, Statistica 6 |
23.10.2008 - 18:38
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Представлять отдельно, как написано. Только вот не пойму зачем Вам формула? Результаты логистической регрессии принято описывать в таблице с указанием (по столбцам) наименования переменной - значения коэффициента регрессии - ошибки коэффициента регрессии - отношения шансов - 95% ДИ отношения шансов - р (хотя можно и не писать).
Повторюсь, когда у Вас 60 человек в двух группах, лучше о прогнозе не даже и не заикаться. |
|
24.10.2008 - 05:54
Сообщение
#17
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 19.10.2008 Пользователь №: 5416 |
Понятно, спасибо! А коэффициенты корреляции нужно указывать, чтобы объяснить тип и силу связи между факторами?
|
|
24.10.2008 - 07:32
Сообщение
#18
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 19.10.2008 Пользователь №: 5416 |
Знаете, ваш форум просто удивительный, не просто умные люди, с одного слова понимающие куда направить, но ни на одном форуме никогда не встречала такой вежливости, при чем еще и при ответах на такие глупые вопросы, как мои например! Огромное Вам спасибо!
|
|
24.10.2008 - 10:40
Сообщение
#19
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Понятно, спасибо! А коэффициенты корреляции нужно указывать, чтобы объяснить тип и силу связи между факторами? Коэффициент корреляции? А он откуда? Силу связи фактора с бинарным показателем (тем, что используется в логистической регрессии) описывает отношение шансов. Напомню, что отношение шансов показывает, во сколько раз шансы исхода (например, смерти) выше у человека с данным фактором по сравнению с человеком без него. Для единичного изменения (на 1 кг измнения массы) отношение шансов равно exp(beta), где beta - коэффициент логистической регрессии для данного фактора, а exp - основание натуральных логарифмов. Иными словами, если бета=1, ОШ=2,7. Некоторую проблему у Вас создает кодирование денситометрических показателей из.масса - 0.007 денсит(налич) - 0.003 степень_ден(силь) - 0.003 возраст(старше 46) -0.098 и уравнение Y=-26.600 + 0.959X1 - 5.139X2 + 6.869X3 + 2.767X4 Итак, для изменения массы ОШ=2,6 для наличия денситометрических изменений, но при отсутсвии сильных изменений ОШ=0,006 Наличие сильный изменений ОШ=5,6 (при кодировании была схема 1 1, значит при сильных денситометрических изменениях имеем -5,139+6,869=1,73). В этом случае, правда, есть проблемы в рассчете ДИ. Кстати, уверены, что коэффициенты такие большие? Я посчитал, что Вы привели выше уравнение логистической регрессии, если нет - то делать все то же самое, но с коэффициентами логистической регрессии. |
|
24.10.2008 - 12:47
Сообщение
#20
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 19.10.2008 Пользователь №: 5416 |
Здравствуйте! В уравнении приведены b-коэффициенты из таблицы.
Не подскажете, я могу что либо изменить, чтобы ДИ был менее проблематичен? |
|
24.10.2008 - 17:39
Сообщение
#21
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
1. Доверительный интервал для коэффициентов регрессии заменяет квалификационная таблица: Classification Table. Именно она показывает качество прогнозной модели. Вы должны хорошо (с большой долей вероятности) предсказывать как положительные рецидивы, так и отсутствие рецидивов. Убедитесь, что указанные вероятности Вас устраивают.
2. Корреляционная матрица для независимых факторов покажет силу связи между ними. Чем сильнее взаимозависимость между 2-мя факторами, тем с большей уверенностью можно исключить один из этих факторов из прогноза. В случае линейной связи логистическая регрессия может дать ошибочные результаты. Поэтому лучше перед регрессией убедиться в отсутствии парных корреляций. 3. Логистическая регрессия позволяет исследовать нелинейное влияние параметров. В частности, наряду с самими клиническими переменными, в анализ можно включить их произведения. Значимость p-value произведения говорит, что параметры влияют нелинейно. 4. Приводите результаты своих расчетов, чтобы мы могли конструктивно их обсуждать. Сообщение отредактировал DoctorStat - 24.10.2008 - 17:41 Просто включи мозги => http://doctorstat.narod.ru
|
|
25.10.2008 - 11:53
Сообщение
#22
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
1. Доверительный интервал для коэффициентов регрессии заменяет квалификационная таблица: Classification Table. Именно она показывает качество прогнозной модели. Вы должны хорошо (с большой долей вероятности) предсказывать как положительные рецидивы, так и отсутствие рецидивов. Убедитесь, что указанные вероятности Вас устраивают. Не совсем так. Качество прогнозной модели показывает не классификационная таблица а степень снижения логарифма отношения правдопдобия между данной моделью и более простой моделью (Hosmer, Lemeshow, 2000). Классификационная таблица сильно зависит от исходных данных. Доверительные интервалы для коэффициентов регрессии ни классификационная таблица, ни отношения правдоподобия не заменяют, поскольку отвечают на разные вопросы - одно, насколько хороша модель, а второе - насколько важен данный параметр в модели. 2. Корреляционная матрица для независимых факторов покажет силу связи между ними. Чем сильнее взаимозависимость между 2-мя факторами, тем с большей уверенностью можно исключить один из этих факторов из прогноза. В случае линейной связи логистическая регрессия может дать ошибочные результаты. Поэтому лучше перед регрессией убедиться в отсутствии парных корреляций. В описанных в посте данных большая часть - качественные. Анализировать точечно-бисериальные коэффициенты для исключения факторов из анализа обычно не принято. Разумнее просто внимательно проанализировать модели с включением разных параметров и их сочетаний. |
|
27.10.2008 - 09:00
Сообщение
#23
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 19.10.2008 Пользователь №: 5416 |
Здравствуйте! Данные из таблиц.
Omnibus Tests of Model Coefficients Chi-square df Sig. Step 68,321 4 ,000 Block 68,321 4 ,000 Model 68,321 4 ,000 -------------------------------- Model Summary -2 Log likelihood Cox & Snell R Square Nagelkerke R Square 24,869a ,628 ,848 -------------------------------------- Classification Table Observed Predicted rec_klin Percentage Correct "клин" "pec" rec_klin "клин" 35 6 85,4 "pec" 3 25 89,3 Overall Percentage 87,0 ------------------------------------------- Variables in the Equation B S.E. Wald df Sig. Exp(B) 95,0% C.I.for EXP(B) Lower Upper Step 1a izb_mas ,959 ,357 7,237 1 ,007 2,610 1,297 5,249 densitom -5,139 1,737 8,754 1 ,003 ,006 ,000 ,176 stepen_densit 6,869 2,334 8,664 1 ,003 962,157 9,927 9,325E4 vozrast 2,767 1,672 2,738 1 ,098 15,912 ,600 421,830 Constant -26,600 10,181 6,826 1 ,009 ,000 -------------------------------------------- |
|
27.10.2008 - 09:03
Сообщение
#24
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 19.10.2008 Пользователь №: 5416 |
Извините, лучше прикреплю файл, а то совершенно нечитаемо получилось
Прикрепленные файлы
|
|
27.10.2008 - 10:39
Сообщение
#25
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
По-моему результат отличный! Интегральная модель высоко значима: р=0,000 (Omnibus Tests of Model Coefficients). Угадано 85% клин и 89% рес (Classification Table). Все независимые переменные, кроме vozrast высоко значимы (Variables in the Equation). Непонятно только, почему vozrast со значимостью Sig=0,098 не был автоматически исключен из списка? Малозначимая переменная vozrast искажает коэффициенты регрессии. Ее нужно убрать из анализа либо вручную, а лучше автоматически.
Просто включи мозги => http://doctorstat.narod.ru
|
|
27.10.2008 - 11:54
Сообщение
#26
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 19.10.2008 Пользователь №: 5416 |
Непонятно только, почему vozrast со значимостью Sig=0,098 не был автоматически исключен из списка? Малозначимая переменная vozrast искажает коэффициенты регрессии. Ее нужно убрать из анализа либо вручную, а лучше автоматически Да, действительно, не убирается автоматически, пришлось убрать вручную. То есть остаются только три значимых признака. Можно еще вопрос, ROC- кривая, ее нужно делать, или это будет лишнее?
|
|
27.10.2008 - 12:30
Сообщение
#27
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
ROC- кривая, ее нужно делать, или это будет лишнее? Насколько я понимаю, Receiver Operating Characteristic, ROC - кривая показывает зависимость чувствительности метода от его специфичности. Но классификационная таблица (Classification Table) дала Вам только ОДНУ точку на этой кривой! Откуда Вы возьмете другие точки!? Какие параметры логистической регрессии Вы собираетесь менять для построения ROC-кривой? Сообщение отредактировал DoctorStat - 27.10.2008 - 12:30 Просто включи мозги => http://doctorstat.narod.ru
|
|
27.10.2008 - 12:45
Сообщение
#28
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Насколько я понимаю, Receiver Operating Characteristic, ROC - кривая показывает зависимость чувствительности метода от его специфичности. Но классификационная таблица (Classification Table) дала Вам только ОДНУ точку на этой кривой! Откуда Вы возьмете другие точки!? Какие параметры логистической регрессии Вы собираетесь менять для построения ROC-кривой? Для построения ROC при логистическом анализе меняются не параметры регрессии, а порог отсечения. Мне вообще удивительно упорство некоторых исследователей. Предлагается бесплатное ПО, которое все это делает в автоматическом режиме, притом содержит подробнейшие пояснения, но нет! Мы будем биться головой об стену, но не будем слушать дельных советов. ROC, спасибо плав-у, подробно обсужден в других ветках форума. Сообщение отредактировал Игорь - 27.10.2008 - 12:48 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
27.10.2008 - 14:58
Сообщение
#29
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 19.10.2008 Пользователь №: 5416 |
Понятно, спасибо!
|
|