Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V  < 1 2  
Добавить ответ в эту темуОткрыть тему
> Прогнозирование риска рецидивов, Statistica 6
плав
сообщение 23.10.2008 - 18:38
Сообщение #16





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Представлять отдельно, как написано. Только вот не пойму зачем Вам формула? Результаты логистической регрессии принято описывать в таблице с указанием (по столбцам) наименования переменной - значения коэффициента регрессии - ошибки коэффициента регрессии - отношения шансов - 95% ДИ отношения шансов - р (хотя можно и не писать).
Повторюсь, когда у Вас 60 человек в двух группах, лучше о прогнозе не даже и не заикаться.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
saymay
сообщение 24.10.2008 - 05:54
Сообщение #17





Группа: Пользователи
Сообщений: 15
Регистрация: 19.10.2008
Пользователь №: 5416



Понятно, спасибо! А коэффициенты корреляции нужно указывать, чтобы объяснить тип и силу связи между факторами?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
saymay
сообщение 24.10.2008 - 07:32
Сообщение #18





Группа: Пользователи
Сообщений: 15
Регистрация: 19.10.2008
Пользователь №: 5416



Знаете, ваш форум просто удивительный, не просто умные люди, с одного слова понимающие куда направить, но ни на одном форуме никогда не встречала такой вежливости, при чем еще и при ответах на такие глупые вопросы, как мои например! Огромное Вам спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 24.10.2008 - 10:40
Сообщение #19





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(saymay @ 24.10.2008 - 06:54) *
Понятно, спасибо! А коэффициенты корреляции нужно указывать, чтобы объяснить тип и силу связи между факторами?

Коэффициент корреляции? А он откуда? Силу связи фактора с бинарным показателем (тем, что используется в логистической регрессии) описывает отношение шансов. Напомню, что отношение шансов показывает, во сколько раз шансы исхода (например, смерти) выше у человека с данным фактором по сравнению с человеком без него.
Для единичного изменения (на 1 кг измнения массы) отношение шансов равно exp(beta), где beta - коэффициент логистической регрессии для данного фактора, а exp - основание натуральных логарифмов. Иными словами, если бета=1, ОШ=2,7.
Некоторую проблему у Вас создает кодирование денситометрических показателей
из.масса - 0.007
денсит(налич) - 0.003
степень_ден(силь) - 0.003
возраст(старше 46) -0.098
и уравнение Y=-26.600 + 0.959X1 - 5.139X2 + 6.869X3 + 2.767X4
Итак,
для изменения массы ОШ=2,6
для наличия денситометрических изменений, но при отсутсвии сильных изменений ОШ=0,006
Наличие сильный изменений ОШ=5,6 (при кодировании была схема 1 1, значит при сильных денситометрических изменениях имеем -5,139+6,869=1,73). В этом случае, правда, есть проблемы в рассчете ДИ.
Кстати, уверены, что коэффициенты такие большие? Я посчитал, что Вы привели выше уравнение логистической регрессии, если нет - то делать все то же самое, но с коэффициентами логистической регрессии.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
saymay
сообщение 24.10.2008 - 12:47
Сообщение #20





Группа: Пользователи
Сообщений: 15
Регистрация: 19.10.2008
Пользователь №: 5416



Здравствуйте! В уравнении приведены b-коэффициенты из таблицы.
Не подскажете, я могу что либо изменить, чтобы ДИ был менее проблематичен?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 24.10.2008 - 17:39
Сообщение #21





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



1. Доверительный интервал для коэффициентов регрессии заменяет квалификационная таблица: Classification Table. Именно она показывает качество прогнозной модели. Вы должны хорошо (с большой долей вероятности) предсказывать как положительные рецидивы, так и отсутствие рецидивов. Убедитесь, что указанные вероятности Вас устраивают.
2. Корреляционная матрица для независимых факторов покажет силу связи между ними. Чем сильнее взаимозависимость между 2-мя факторами, тем с большей уверенностью можно исключить один из этих факторов из прогноза. В случае линейной связи логистическая регрессия может дать ошибочные результаты. Поэтому лучше перед регрессией убедиться в отсутствии парных корреляций.
3. Логистическая регрессия позволяет исследовать нелинейное влияние параметров. В частности, наряду с самими клиническими переменными, в анализ можно включить их произведения. Значимость p-value произведения говорит, что параметры влияют нелинейно.
4. Приводите результаты своих расчетов, чтобы мы могли конструктивно их обсуждать.

Сообщение отредактировал DoctorStat - 24.10.2008 - 17:41


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 25.10.2008 - 11:53
Сообщение #22





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DoctorStat @ 24.10.2008 - 18:39) *
1. Доверительный интервал для коэффициентов регрессии заменяет квалификационная таблица: Classification Table. Именно она показывает качество прогнозной модели. Вы должны хорошо (с большой долей вероятности) предсказывать как положительные рецидивы, так и отсутствие рецидивов. Убедитесь, что указанные вероятности Вас устраивают.

Не совсем так. Качество прогнозной модели показывает не классификационная таблица а степень снижения логарифма отношения правдопдобия между данной моделью и более простой моделью (Hosmer, Lemeshow, 2000). Классификационная таблица сильно зависит от исходных данных.
Доверительные интервалы для коэффициентов регрессии ни классификационная таблица, ни отношения правдоподобия не заменяют, поскольку отвечают на разные вопросы - одно, насколько хороша модель, а второе - насколько важен данный параметр в модели.

Цитата(DoctorStat @ 24.10.2008 - 18:39) *
2. Корреляционная матрица для независимых факторов покажет силу связи между ними. Чем сильнее взаимозависимость между 2-мя факторами, тем с большей уверенностью можно исключить один из этих факторов из прогноза. В случае линейной связи логистическая регрессия может дать ошибочные результаты. Поэтому лучше перед регрессией убедиться в отсутствии парных корреляций.

В описанных в посте данных большая часть - качественные. Анализировать точечно-бисериальные коэффициенты для исключения факторов из анализа обычно не принято. Разумнее просто внимательно проанализировать модели с включением разных параметров и их сочетаний.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
saymay
сообщение 27.10.2008 - 09:00
Сообщение #23





Группа: Пользователи
Сообщений: 15
Регистрация: 19.10.2008
Пользователь №: 5416



Здравствуйте! Данные из таблиц.

Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 68,321 4 ,000
Block 68,321 4 ,000
Model 68,321 4 ,000
--------------------------------
Model Summary
-2 Log likelihood Cox & Snell R Square Nagelkerke R Square
24,869a ,628 ,848

--------------------------------------
Classification Table
Observed Predicted
rec_klin Percentage Correct
"клин" "pec"
rec_klin "клин" 35 6 85,4
"pec" 3 25 89,3
Overall Percentage 87,0

-------------------------------------------
Variables in the Equation
B S.E. Wald df Sig. Exp(B) 95,0% C.I.for EXP(B)
Lower Upper
Step 1a izb_mas ,959 ,357 7,237 1 ,007 2,610 1,297 5,249
densitom -5,139 1,737 8,754 1 ,003 ,006 ,000 ,176
stepen_densit 6,869 2,334 8,664 1 ,003 962,157 9,927 9,325E4
vozrast 2,767 1,672 2,738 1 ,098 15,912 ,600 421,830
Constant -26,600 10,181 6,826 1 ,009 ,000

--------------------------------------------

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
saymay
сообщение 27.10.2008 - 09:03
Сообщение #24





Группа: Пользователи
Сообщений: 15
Регистрация: 19.10.2008
Пользователь №: 5416



Извините, лучше прикреплю файл, а то совершенно нечитаемо получилось
Прикрепленные файлы
Прикрепленный файл  logist_regress.doc ( 256,03 килобайт ) Кол-во скачиваний: 415
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 27.10.2008 - 10:39
Сообщение #25





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



По-моему результат отличный! Интегральная модель высоко значима: р=0,000 (Omnibus Tests of Model Coefficients). Угадано 85% клин и 89% рес (Classification Table). Все независимые переменные, кроме vozrast высоко значимы (Variables in the Equation). Непонятно только, почему vozrast со значимостью Sig=0,098 не был автоматически исключен из списка? Малозначимая переменная vozrast искажает коэффициенты регрессии. Ее нужно убрать из анализа либо вручную, а лучше автоматически.


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
saymay
сообщение 27.10.2008 - 11:54
Сообщение #26





Группа: Пользователи
Сообщений: 15
Регистрация: 19.10.2008
Пользователь №: 5416



Непонятно только, почему vozrast со значимостью Sig=0,098 не был автоматически исключен из списка? Малозначимая переменная vozrast искажает коэффициенты регрессии. Ее нужно убрать из анализа либо вручную, а лучше автоматически Да, действительно, не убирается автоматически, пришлось убрать вручную. То есть остаются только три значимых признака. Можно еще вопрос, ROC- кривая, ее нужно делать, или это будет лишнее?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 27.10.2008 - 12:30
Сообщение #27





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(saymay @ 27.10.2008 - 11:54) *
ROC- кривая, ее нужно делать, или это будет лишнее?

Насколько я понимаю, Receiver Operating Characteristic, ROC - кривая показывает зависимость чувствительности метода от его специфичности. Но классификационная таблица (Classification Table) дала Вам только ОДНУ точку на этой кривой! Откуда Вы возьмете другие точки!? Какие параметры логистической регрессии Вы собираетесь менять для построения ROC-кривой?

Сообщение отредактировал DoctorStat - 27.10.2008 - 12:30


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 27.10.2008 - 12:45
Сообщение #28





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(DoctorStat @ 27.10.2008 - 12:30) *
Насколько я понимаю, Receiver Operating Characteristic, ROC - кривая показывает зависимость чувствительности метода от его специфичности. Но классификационная таблица (Classification Table) дала Вам только ОДНУ точку на этой кривой! Откуда Вы возьмете другие точки!? Какие параметры логистической регрессии Вы собираетесь менять для построения ROC-кривой?

Для построения ROC при логистическом анализе меняются не параметры регрессии, а порог отсечения.

Мне вообще удивительно упорство некоторых исследователей. Предлагается бесплатное ПО, которое все это делает в автоматическом режиме, притом содержит подробнейшие пояснения, но нет! Мы будем биться головой об стену, но не будем слушать дельных советов.

ROC, спасибо плав-у, подробно обсужден в других ветках форума.

Сообщение отредактировал Игорь - 27.10.2008 - 12:48


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
saymay
сообщение 27.10.2008 - 14:58
Сообщение #29





Группа: Пользователи
Сообщений: 15
Регистрация: 19.10.2008
Пользователь №: 5416



Понятно, спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V  < 1 2
Добавить ответ в эту темуОткрыть тему