Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Анализ выживаемости, помогите интерпретировать результаты
b16
сообщение 23.12.2007 - 19:50
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 19.12.2007
Пользователь №: 4633



Добрый день,
помогите проинтерпретировать результаты анализа выживаемости полученные в R.
  1. Верно ли, что при Локализации.1 = "Циркулярный" риск повышается в 4.40e+00 раза и это статистически значимо?
  2. зачем нужны коэффициенты для которых p>0.05?
  3. как интерпретировать коэффициенты для непрерывных переменных, например "Вес"? Если вес измеряется в килограммах, то при увеличении веса на килограмм, риск снижается? на сколько? пропорционально exp(Вес*coef)?
  4. какие выводы можно сделать по колонке z?
  5. о чем говорит Likelihood ratio test=196 on 33 df, p=0 n= 772?
  6. достаточно ли следить чтобы p было >0.05 в остатках (cox.zph)? А если будет меньше, то что это значит, и что делать?
Документация по R конечно же прочитана и перечитана, но она не о том как интерпретировать результаты. А сам я не статистик.
  • http://rss.acs.unt.edu/Rdoc/library/survival/html/coxph.html
  • http://rss.acs.unt.edu/Rdoc/library/survival/html/coxph.object.html
  • http://rss.acs.unt.edu/Rdoc/library/survival/html/cox.zph.html
С уважением.

CODE

coxph(formula = Surv(live_month, live_boolean) ~ Q..не.Q + Локализация.1 +
ПИКС + ФТ.ФЖ + СН + Вес + S.пов.тел + XC + ЛПВП + Лейкоциты.1 +
Лимфоциты.1 + Микст.1 + Лимфоциты...абс + ПЖ + ЧСС.ср.д +
ЧССср.н + Жел.нр + LAS.40 + OM + VLF + HF.a + CD95 + CD14.abc +
Хир.кор + ПИМ, data = hrfixed)


coef exp(coef) se(coef) z p
Q..не.QНе-Q -0.47480 6.22e-01 2.61e-01 -1.820 0.06900
Локализация.1Передний 0.02754 1.03e+00 2.59e-01 0.106 0.92000
Локализация.1Циркулярный 1.48216 4.40e+00 4.56e-01 3.248 0.00120
ПИКСНет -0.85368 4.26e-01 2.35e-01 -3.626 0.00029
ФТ.ФЖнет -0.73385 4.80e-01 4.98e-01 -1.473 0.14000
СНстепень 1 9.13042 9.23e+03 6.78e-01 13.467 0.00000
СНстепень 2 10.41516 3.34e+04 6.30e-01 16.526 0.00000
СНстепень 3 11.42514 9.16e+04 6.17e-01 18.519 0.00000
СНстепень 4 NA NA 0.00e+00 NA NA
Вес -0.08072 9.22e-01 3.43e-02 -2.352 0.01900
S.пов.тел 5.92044 3.73e+02 2.56e+00 2.316 0.02100
XC -0.14850 8.62e-01 9.42e-02 -1.576 0.12000
ЛПВП 1.50814 4.52e+00 5.71e-01 2.640 0.00830
Лейкоциты.1 0.09289 1.10e+00 6.18e-02 1.504 0.13000
Лимфоциты.1 -1.12664 3.24e-01 4.09e-01 -2.753 0.00590
Микст.1 0.55833 1.75e+00 2.46e-01 2.273 0.02300
Лимфоциты..абс 0.25261 1.29e+00 1.72e-01 1.467 0.14000
ПЖ -0.07301 9.30e-01 3.36e-02 -2.170 0.03000
ЧСС.ср.д 0.04684 1.05e+00 2.32e-02 2.015 0.04400
ЧССср.н -0.04172 9.59e-01 2.55e-02 -1.635 0.10000
Жел.нрLown 1 0.16677 1.18e+00 4.93e-01 0.338 0.74000
Жел.нрLown 2 1.80165 6.06e+00 6.35e-01 2.838 0.00450
Жел.нрLown 3 0.58155 1.79e+00 6.10e-01 0.954 0.34000
Жел.нрLown 4 1.45021 4.26e+00 5.68e-01 2.555 0.01100
Жел.нрLown 5 0.55726 1.75e+00 6.28e-01 0.887 0.37000
LAS.40 0.01456 1.01e+00 8.61e-03 1.690 0.09100
OM -0.00184 9.98e-01 7.61e-04 -2.418 0.01600
VLF 0.00221 1.00e+00 8.35e-04 2.651 0.00800
HF.a 0.00328 1.00e+00 1.68e-03 1.954 0.05100
CD95 0.08546 1.09e+00 3.39e-02 2.520 0.01200
CD14.abc -44.11843 6.91e-20 2.57e+01 -1.717 0.08600
Хир.корнет 0.36941 1.45e+00 4.41e-01 0.838 0.40000
Хир.корРТСА -1.39345 2.48e-01 7.91e-01 -1.763 0.07800
Хир.корРТСА, АКШ NA NA 0.00e+00 NA NA
ПИМнет -0.57346 5.64e-01 3.23e-01 -1.778 0.07500

Likelihood ratio test=196 on 33 df, p=0 n= 772
> cox.zph(fit)
Предупреждение в cor(xx, r2) : стандартное отклонение нулевое
rho chisq p
Q..не.QНе-Q 0.05982 0.44597 0.50426
Локализация.1Передний 0.07753 0.75124 0.38608
Локализация.1Циркулярный 0.04330 0.20367 0.65177
ПИКСНет 0.13235 2.28928 0.13027
ФТ.ФЖнет 0.02568 0.07950 0.77797
СНстепень 1 0.05422 0.30501 0.58076
СНстепень 2 0.05907 0.37656 0.53945
СНстепень 3 0.06867 0.51924 0.47117
СНстепень 4 NA NaN NaN
Вес -0.06398 0.38873 0.53297
S.пов.тел 0.09461 0.89000 0.34548
XC -0.01763 0.03191 0.85823
ЛПВП 0.01984 0.02642 0.87087
Лейкоциты.1 -0.13920 2.23585 0.13484
Лимфоциты.1 0.01540 0.01789 0.89360
Микст.1 -0.07705 0.48942 0.48419
Лимфоциты..абс 0.05073 0.20250 0.65271
ПЖ 0.10986 0.93932 0.33245
ЧСС.ср.д -0.05176 0.13409 0.71423
ЧССср.н 0.10944 0.81213 0.36749
Жел.нрLown 1 -0.17061 3.09846 0.07837
Жел.нрLown 2 -0.14439 2.23242 0.13514
Жел.нрLown 3 -0.26903 8.41526 0.00372
Жел.нрLown 4 -0.10664 1.21602 0.27014
Жел.нрLown 5 -0.09899 1.05576 0.30418
LAS.40 -0.18258 3.40617 0.06495
OM -0.00798 0.00595 0.93850
VLF -0.00494 0.00248 0.96027
HF.a 0.04073 0.13432 0.71399
CD95 -0.02392 0.10896 0.74133
CD14.abc -0.01548 0.01819 0.89272
Хир.корнет 0.07924 0.66429 0.41505
Хир.корРТСА 0.07889 0.73417 0.39153
Хир.корРТСА, АКШ NA NaN NaN
ПИМнет -0.04694 0.23996 0.62424
GLOBAL NA 31.52953 0.63642


Signature
С уважением.
--
http://r-naive.blogspot.com/
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
плав
сообщение 30.06.2008 - 10:41
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Здесь надо подробно читать статьи, лежащие в основе этих функций, поскольку предлагаемые подходы не являются общепринятыми. Вкратце, идея базируется на том, что у нас называется "методы с интенсивным использованием ЭВМ", а у них bootstrap. Делается несколько выборок (в Вашем случае 15) с повторами из исходной выборки и пересчитывается модель. Затем анализируются полученные регресионные коэффициенты и их распределение.
Соответственно, данная система не защищает Вас от проблем с пропущенными данными (она используется для ухода от предположения от нормального распределения ошибок статистик), а я так понял по посту это являлось важной причиной, почему не стали использовать обычные подходы к анализу той же модели Кокса.
Оптимизм - это разность суммарной ошибки оригинальной модели и бустрапных.
Насчет же конкретной модели замечу только, что результаты сомнительные. 1) Количество выборок для bootstrap всег лишь 15. Стандартно необходимо больше 50, но лучше до 500 (в статьях бывает 200, время расчетов вырастет неимоверно, но иначе оценки подозрительны) 2) Коэффициент множественной корреляции равен 1. Это обычно означает подгонку модели под данные (т.е. грубо говоря аналог проведения прямой через две точки - никакой остаточной вариабельности нет). 3) При этом D крайне мал (он чем выше, тем лучше). Посмотрите еще на индекс Сомерса (Dxy), если он также низок, это опять-таки указывает на низкую валидность модели.
Если интересно разобраться в методологии, особенно в сочетании с рекомендованной мною ранее импутацией, см.
http://www.pubmedcentral.nih.gov/articlere...i?artid=1945032 и список литературы в этой статье
Однако по большому счету, если не чувствуете себя вполне уверенно во всех фокусах бутстрапа и Ко. лучше начните с простой модели Кокса с подстановкой средних вместо пропущенных, затем удалите пропущенные наблюдения, затем подставьте минимальное и максимальное значения. Посмотрите вручную на результаты. Если они будут кто в лес, кто по дрова, значит по этим данным никаких выводов делать нельзя и надо уменьшать количество предикторов/набирать пациентов. Если они похожи друг на друга, тогда можно пытаться строить модели.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему