Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

4 страниц V  < 1 2 3 4 >  
Добавить ответ в эту темуОткрыть тему
> Анализ данных типа времени жизни, некоторые практические вопросы
Игорь
сообщение 30.12.2008 - 08:31
Сообщение #16





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Нельзя сказать, что все понял.

Немного иначе тогда. Зачем нужен график выживаемости? Если для иллюстрации состояния дел к конкретном случае (патологии, метода, клиники), то приводить состояние наблюдаемого случая на графике (умер - 0, цензурирован - +), конечно, нужно. Но в таком случае график лишь заменяет таблицу, хотя и радикально улучшая восприятие информации.

Но при изучении источников мне казалось, что не эта иллюстративная цель в построении графика основная. Может быть, основной целью графика выживаемости все-таки является прогнозирование исхода для конкретного пациента (пусть даже не участвовавшего в исследовании), имеющего данное заболевание? Например, при таком-то заболевании вероятность остаться в живых через полгода (после выявления симптомов заболевания) для данного пациента (пока живого) составляет 0,875.

Да, еще такая проблема. Пусть для данного срока имеется 5 случаев (3 умерли, 2 цензурированы). На графике 3 нуля и 2 креста сольются. Как быть?

Сообщение отредактировал Игорь - 30.12.2008 - 08:33


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 30.12.2008 - 15:39
Сообщение #17





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Если коротко, поскольку уже включен проект Новый Год, то графики К-М характеризуют группу или демонстрируют различия в нескольких группах, как я проиллюстрировала. Храрктеристики - медиана, квартили и соответствующие критерии сравнения функции выживаемости. А чтобы для каждрго конкретного больного посчитать функцию выживаемости используют cox регрессию и по его данным строят кривую вероятности выживания на каждый срок. Такой случай, что в один и тот же день один больной умер, а другой ответил и он жив, на графике при этом плюс и нуль совпадут.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 30.12.2008 - 19:07
Сообщение #18





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Игорь @ 30.12.2008 - 08:31) *
Нельзя сказать, что все понял.

Немного иначе тогда. Зачем нужен график выживаемости? Если для иллюстрации состояния дел к конкретном случае (патологии, метода, клиники), то приводить состояние наблюдаемого случая на графике (умер - 0, цензурирован - +), конечно, нужно. Но в таком случае график лишь заменяет таблицу, хотя и радикально улучшая восприятие информации.

Но при изучении источников мне казалось, что не эта иллюстративная цель в построении графика основная. Может быть, основной целью графика выживаемости все-таки является прогнозирование исхода для конкретного пациента (пусть даже не участвовавшего в исследовании), имеющего данное заболевание? Например, при таком-то заболевании вероятность остаться в живых через полгода (после выявления симптомов заболевания) для данного пациента (пока живого) составляет 0,875.

Да, еще такая проблема. Пусть для данного срока имеется 5 случаев (3 умерли, 2 цензурированы). На графике 3 нуля и 2 креста сольются. Как быть?

Во-первых 5 случаев на одном сроке крайно маловероятно. Повторюсь, единицей измерения обычно является день чтобы было пять случаев надо группу около тысячи человек с ожидаемой продолжительностью жизни один год. Так что в реальности кресты не сливаются.
Во-вторых. Нулем помечать случаи не надо. КМ график является ступенчатым, соответственно, там где ступенька, там и не цензурированный случай.
В-третьих, использовать графики для прогноза опасно, поскольку это эмпирическая - выборочная кривая выживаемости. При использовании другой выборки кривая пойдет иначе. Так что график - просто иллюстрация ситуации и вузуальное сравнение групп и предположения о характере распределения времен дожития.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 2.01.2009 - 12:11
Сообщение #19





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(DrgLena @ 29.12.2008 - 21:35) *
Мне как раз нравится видеть на этих графиках плюсики, но к сожалению там есть и нулики.

Ну это тема для другой ветки. Для себя я понял, что указывать на графике крестики и нолики необходимости нет. Тем более, что в Excel это сделать непросто.

Посмотрел прилагаемую презентацию. Спасибо. Оказалась кстати (но и вызвала ряд вопросов), т.к. в изучении выживаемости добрался до сравнения графиков выживаемости. Один из вопросов возник относительно методики сравнения, представленной на втором слайде. Например, Скрипник с соавт. в книге "Анализ надежности технических систем по цензурированным выборкам" полагают, что необходимо использовать логарифмический ранговый критерий (он же критерий Кокса, он же обобщенный критерий Сэвиджа). Реализация данного метода на основе критерия Сэвиджа сложности совершенно не вызвала.

Позволю себе цитату из упомянутой монографии (с. 120): " ... при наличии цензурирования критерий Пирсона становится практически неприменим, а критерии Колмогорова и Крамера-Мизеса теряют многие из своих свойств и требуют проведения дополнительных специальных исследований для определения распределений порождаемых статистик".

Как оказалось, не зря я приобрел "про запас" монографию Скрипника с соавт. 1988 года издания, т.к. книга Кокса и Оукса, в том же году изданная, вопреки рекламе из предисловия, никакого "неформального введения" в предмет не дает, а представляет собой безусловно полезное эссе (составленное грамотными - почти гениями, но методически неопытными авторами), полезное для чтения лишь после всестороннего изучения предмета по другим источникам. При первом изучении Кокса-Оукса ничего не понятно. После же изучения предмета и повторном чтении данной книги постоянно не покидает мысль: "Вот-вот, где-то я это уже видел". smile.gif

Замечание к обсуждению дисперсии. При некоторых наборах исходных данных формула Гринвуда оказывается неприменимой по причине появления нуля в знаменателе.

Сообщение отредактировал Игорь - 2.01.2009 - 18:15


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 2.01.2009 - 18:44
Сообщение #20





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Я не очень поняла вопроса. Хи квадр, не значит Присона. По второму слайду, например
Overall Comparisons
Log Rank (Mantel-Cox) Chi-Square=66,250
Breslow (Generalized Wilcoxon) Chi-Square=65,563
Tarone-Ware Chi-Square=67,372 (Это SPSS)
Т.е. При больших выборках практически одинаковые значения критериев.

При сравнении двух выборок программа Statistica предлагает 5 тестов.
Кое что про них известно,

Gehan?s Wilcoxon наиболее часто используют, рекомендуют в тех случаях, когда различия в кривых наиболее выражены в начальный период наблюдения, а также, когда нарушается модель пропорциональных рисков.
Cox?s используют при экспоненциально распределенных выборках. Этот критерий особенно чувствителен к различиям на концах распределений.
Log-Rank Test рекомендуют, когда наблюдаемое число смертей мало.

Я предпочитаю Cox?s и Log-Rank Test просто потому, что в зарубежных публикациях по этой патологии чаще их используют, это наиболее мощные критерии, но риск у меня не пропорциональный, а с хвостами распределения, я не всегда знаю как поступать.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 2.01.2009 - 18:55
Сообщение #21





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Я из ранее представленной презентации сделала график сравнения двух групп, клечточный тип 2 и 3. Сравнения по 5 критериям
1. Gehan's Wilcoxon Test WW = -7355. Sum = 2044E4 Var = 4930E3 Test statistic = -3.31239 p = .00093
2. Cox's F-Test T1 = 93.42011 T2 = 68.57989 F( 98, 224) = 1.677947 p = .00088
3. Cox-Mantel Test I = 39.30574 U = -20.9806 Test statistic = -3.34649 p = .00082
4. Peto & Peto Wilcoxon Test WW = 17.310 Sum = 108.88 Var = 26.259 Test statistic = 3.377951 p = .00073
5. Log-Rank Test WW = 20.981 Sum = 160.11 Var = 38.613 Test statistic = 3.376394 p = .00073

Может пригодится тому, кто пишет...
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 11.01.2009 - 06:54
Сообщение #22





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Спасибо, интересная информация. Не совсем понятна тяга разработчиков к хи-квадрат. В источниках представлена нормальная аппроксимация для тех же методов. Но это непринципиально.

Возник еще вопрос. Задача такая - имеется плотность эмпирического распределения. Задача - подобрать подходящее теоретическое распределение.

В источниках теоретическое распределение обычно подбирается по исходным данным. Но тут несколько иная постановка.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 11.01.2009 - 16:22
Сообщение #23





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Нашел в книге Кобзаря.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Ssovev
сообщение 17.01.2009 - 14:02
Сообщение #24





Группа: Пользователи
Сообщений: 2
Регистрация: 16.01.2009
Пользователь №: 5721



Это что за книга такая?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 17.01.2009 - 16:06
Сообщение #25





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Ssovev @ 17.01.2009 - 14:02) *
это что за книга такая?

Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2006.

Опубликована версия AtteStat 10, в которую вошел модуль "Анализ выживаемости" со всеми необходимыми теоретическими обоснованиями. Предварительно, программа будет доступна для скачивания до 10 февраля включительно, после чего за неуплату сайт будет ликвидирован. Затем программа будет доступна бесплатно только по электронной почте после направления автору соответствующего запроса. Это предварительно. Если удастся найти источник финансирования, все останется по-прежнему.

Сообщение отредактировал Игорь - 18.01.2009 - 13:17


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Igoroshka
сообщение 22.01.2009 - 15:50
Сообщение #26





Группа: Пользователи
Сообщений: 53
Регистрация: 22.06.2007
Пользователь №: 4178



Несколько книг по "выживаемости".
Advances in Survival Analysis. Rao, Balakrishnan. Elsevier, 2003
Applied Survival Analysis - Regression Modeling of Time to Event Data. Hosmer, Lemeshow (есть примеры на R, SAS, Stata, SPSS)
Dynamic Regression Models For Survival Data. Martinussen, Scheike
Regression Models and Life-Tables. Cox. 1972
Statistical Methods for Survival Data Analysis. Lee, Wang. 2003, 3ed
Cox Proportional-Hazards Regression for Survival Data. Fox (применительно к R-system)
Survival Analysis. A Self-Learning Text. Kleinbaum, Klein. 2ed. Springer, 2005
Survival Analysis. Stevenson
Survival Analysis for Epidemiologic and Medical Research. Selvin. 2007
The Statistical Analysis of Failure Time Data. Kalbfleisch, Prentice. 2Ed. Wiley, 2002
The Statistical Analysis of Recurrent Events. Cook, Lawless. Springer, 2007
Therneau - frailty
Using Residuals with Cox Models. Terry Therneau
Comparing Marginal and Random Effects Frailty Models. Terry Therneau

Описания многих подходов, используемых при анализе время-событие можно найти в описания модулей R (например, http://cran.gis-lab.info/web/packages/)
survival
muhaz
eha
Design
surv2sample
TSHRC
emplik
dblcens
coin
CPE
coxphf
intcox
NestedCohort
proptest
glmpath
rankreg
quantreg
crq
lss
gamlss.cens
smoothSurv
mixPHM
mvna
frailtypack
survrec
gcmrec
cmprsk
relsurv
MLEcens
CompetingRiskFrailty
DPpackage
survBayes
mboost
CoxBoost
randomSurvivalForest
KMsurv
survivalROC
tpr
party
TwoWaySurvival

Сообщение отредактировал Igoroshka - 22.01.2009 - 16:03
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Igoroshka
сообщение 22.01.2009 - 15:59
Сообщение #27





Группа: Пользователи
Сообщений: 53
Регистрация: 22.06.2007
Пользователь №: 4178



Еще парочка:
Survival Analysis Using S-R. Tableman
Survival Analysis Using the SAS System. A Practical Guide

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 22.01.2009 - 16:47
Сообщение #28





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Igoroshka @ 22.01.2009 - 15:50) *
Несколько книг по "выживаемости".


Не понятно, это к чему? Если Вы эти книги читали и рекомендуете, пожалуйста краткую характеристику.
В противном случае, каждый может на amazon.com ввести слово survival в поиск. Насчет R те же рекомендации - характеристику пакетов и преимущества одного перед другим.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Igoroshka
сообщение 22.01.2009 - 17:46
Сообщение #29





Группа: Пользователи
Сообщений: 53
Регистрация: 22.06.2007
Пользователь №: 4178



На амазоне книг гораздо больше smile.gif.
Это те книги, которые есть у меня, и которыми могу поделиться.

Насчет характеристики -- сложновато. По последней, которую изучал:

Survival Analysis Using S-R. Tableman
Курс лекций Tableman, представленные в виде книги.
Кратко рассмотрена теория, даны примеры анализа выживаемости с использованием S (R-system, S+). При рассмотрении примеров используются как стандартные средства, так и функции, разработанные автором и ассистентами. По тексту функций можно проследить алгоритм.
Рассмотрены следующие вопросы:
. оценки КМ и Нельсона-Аалена; квантили; функция риска
. сравнение выживаемостей (лог-ранговый, Пето, rho Harrington and Fleming
. моделирование выживаемости распределениями: экспоненциальным, Вейбула, лог-нормальным, лог- логистическим, гамма; сравнение групп, моделированных парам. распределениями
. параметрические регрессионные модели; процедура AIC
. регрессионный анализ Кокса; процедура AIC. Стратифицированный регрессионный анализ
. проверка моделей, проверка пропорциональности

Если будет интересно, еще несколько смогу подготовить.

Насчет сравнения модулей для R. Это сложно сделать. Частичное перекрытие функций есть. Но, в основном, каждый из них реализует дополнительные возможности. Например, используя модуль survival можно получить оценку функций риска. Но лучше использовать функции, предложенные в вышеназванной книге. А пакет muhaz дополнительно позволяет получить сглаженные функции риска. Пакет surv2sample позволяет сравнивать выживаемость в 2-х группах с различными весами, а также проверить предположение о пропорциональности рисков и шансов (proportional hazards, proportional odds).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 22.01.2009 - 21:42
Сообщение #30





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(Igoroshka @ 22.01.2009 - 17:46) *
Это те книги, которые есть у меня, и которыми могу поделиться.
Поделитесь книгами со мной smile.gif


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

4 страниц V  < 1 2 3 4 >
Добавить ответ в эту темуОткрыть тему