Допустимая доля цензурированных наблюдений в анализе выживаемости

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Допустимая доля цензурированных наблюдений в анализе выживаемости, а что если 100%?

nokh Просмотр профиля	10.03.2008 - 07:36 Сообщение #1
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Идеальные данные для анализа выживаемости - когда точно известно сколько человек прожил, например, после операции и когда умер. В этом случае цензурированных наблюдений нет. Другой крайний случай - когда все наблюдения цензурированные и дальнейшая судьба пациентов неизвестна. Например один прожил больше года, другой - больше трех. В этом случае может оказаться, что больше года - это 5, а больше трех - это 4. Поэтому, насколько я понимаю, сравнить выживаемость в двух группах где все наблюдения цензурированные невозможно в принципе. А какова допустимая доля цензурированных наблюдений в выборке? Существуют ли какие-то обоснованные или негласные правила? Полазил в и-нете, заглянул в книжки - пока ответа не нашел, хотя везде рассматриваются примеры где полные данные заметно преобладают над цензурированными. Или может считать цензурированными только точно живых на момент анализа, а всех потерявшихся считать умершими в интервале между двумя осмотрами, как прочитал в одной статье?

Ответов

DrgLena

2.12.2008 - 02:37

Сообщение #2

Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573

Я не стала бы возражать уважаемому модератору, но у меня на столе лежит первоисточник, причем на русском языке, крупного английского математика Д.Р. Кокса, который в соавторстве с Д. Оуксом в 1983 году написал эту книгу «Анализ данных типа времен жизни», у нас она вышла в 1988, и к этому времени на русском языке это уже была седьмая его книга. Цель, которой автор посвятил эту работу звучит так, ? изучить влияние различных факторов, которые в этой книге названы поясняющими переменными или ковариатами на продолжительность жизни. В 1972 году Кокс предложил математическую модель, «в рамках которой можно исследовать влияние ковариат на продолжительность жизни». Так написал сам автор метода. Почему же не исследовать. Большинство примеров и упражнения в этой книге - по расчету времени жизни. Так что цели определены.

Мне не ясно другое, какие параметры распределения я должна привести, чтобы показать, что я имею дело именно с распределением Вейбулла, чтобы не было вопросов. Значения лямбда и гамма или значение Shape ? форма и Scale - параметр масштаба? Визуально на приводимых графиках мои данные (та же выборка) согласуются с обоими этими распределениями. Хотя и с экспоненциальным тоже согласуется, но хуже. Возможно из-за большого числа наблюдений.
Поясните мне, пожалуйста, что такое задача AFTM? И что значит метод Вейбулла.

Эскизы прикрепленных изображений

Ответить с цитированием данного сообщения

плав Просмотр профиля	2.12.2008 - 22:18 Сообщение #3
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Цитата(DrgLena @ 2.12.2008 - 02:37) Я не стала бы возражать уважаемому модератору, но у меня на столе лежит первоисточник, причем на русском языке, крупного английского математика Д.Р. Кокса, который в соавторстве с Д. Оуксом в 1983 году написал эту книгу «Анализ данных типа времен жизни», у нас она вышла в 1988, и к этому времени на русском языке это уже была седьмая его книга. Цель, которой автор посвятил эту работу звучит так, ? изучить влияние различных факторов, которые в этой книге названы поясняющими переменными или ковариатами на продолжительность жизни. В 1972 году Кокс предложил математическую модель, «в рамках которой можно исследовать влияние ковариат на продолжительность жизни». Так написал сам автор метода. Почему же не исследовать. Большинство примеров и упражнения в этой книге - по расчету времени жизни. Так что цели определены. Мне не ясно другое, какие параметры распределения я должна привести, чтобы показать, что я имею дело именно с распределением Вейбулла, чтобы не было вопросов. Значения лямбда и гамма или значение Shape ? форма и Scale - параметр масштаба? Визуально на приводимых графиках мои данные (та же выборка) согласуются с обоими этими распределениями. Хотя и с экспоненциальным тоже согласуется, но хуже. Возможно из-за большого числа наблюдений. Поясните мне, пожалуйста, что такое задача AFTM? И что значит метод Вейбулла. Не хочется вступать в длительную дискуссию (например, какое слово переводчики переводили под слово "продолжительность жизни", если survival или hazard, то ситуация меняется кардинальным образом), напомню только вот что: в статье 1972 года Кокс предложил модель, которая была названа моделью пропорционального риска (генерализацию моделей распределения Вейбулла и Гомперца) и, одновременно, новый метод оценки модели под названием частичного правдоподобия (partial likelihood). В модели пропорционального риска риск (hazard) каждого человека определяется как часть общей опасности: h_i(t)/h_j(t)=exp(b1x_i-x_j)+...). Как видно в этом уравнении базовый риск отсутствует. Он исчез при использовании модели пропорциональности риска (т.е. мы сравниваем не выживаемость, а отношения выживаемостей). Гениальность Кокса заключалась как раз в том, что он предложил метод (частичного правдоподобия), который позволял оценить регрессионные коэффициенты (b) не специфицируя фрму распределения функции опасности. Платой за использование этого метода стала некоторая потеря эффективности (при анализе коэффициентов - их стандартные ошибки чуть больше) и невозможность получить информацию о форме и характеристиках фнукции выживаемости из данных модели. Точно так же, как на основании отношения шансов невозможно восстановить ) без дополнительной информации) исходные частоты, так и на основании результатов модели Кокса невозможно оценить исходную функцию выживаемости S(t) (это, напомню, антилогарифм интеграла функции опасности от 0 до t). Настоятельно рекомендую просто разобраться в математике модели, тогда то, что я описываю станет понятным (кстати, просто попробуйте восстановить функцию h(t) на основании того, что представлено в распечатке модели и поймете, что там информации для этого нет). То, что написал Кокс абсолютно правильно, оценить влияние ковариант на функцию выживаемости (точнее опасность) можно, но восстановить саму функцию выживаемости - нет (а это в цитате и не утверждается). И я утверждал именно то же самое - модель Кокса предназначена для оценки факторов риска (т.е. сравнения функций выживаемости друг с другом, а не оценки ее значений). Соответственно, оценивать эту функцию надо как-то по другому - и делается при помощи эмпирической функции выживаемости (точнее, опасности), которая строится по методу Каплана-Мейера. Здесь в теории все заканчивается хорошо, поскольку в теории у нас достаточно значений, чтобы точно определить форму эмпирической кривой. На практике это не так. Точность оценки эмпирической кривой в период времени t, очевидно, зависит от количества доживших до времени t (как и любой другой выборочный метод). Соответственно, если группа риска мала, то и оценка функции выживаемости будет подвержена достаточно большим выборочным колебаниям. Вообще почти все статистические пакеты имеют в своем составе набор программ для оценки и простейшего сравнения фнукицй (кривых) выживаемости. Чаще всего функции оцениваются по методу Каплана-Мейера или методу таблиц дожития и сравниваются статистикой Вилкоксона или Пето (лог-ранг). В моделях AFTM (accelerated failure time models) моделируется изменение функции опасности (выживаемости) под влиянием переменных Формально выбор распределения делается на основе изучения эмпирической функции правдоподобия - если логарифм опасности (hazard) является константой, то соответствующее распределение - экспоненциальное, если линейно зависит от времени (at), то Гомперца, если имеет форму alog(t), где t-время, то распределение Вейбулла. Надо помнить, что если истинное распределение - экспоненциальное, то оценка по моделям Вейбулла или Гомперца будет давать одинаковые кривые. Соответственно, задача аналитика выбрать адекватную функцию распределения и затем строить модель с использованием этой функции (приводятся графиики или используется стандратный тест соответствия теоретического и эмпирического распределений). Уравнение AFTM чаще всего имеет следующий вид log(T_i)=a+b1x1+b2*x2 +... \epsilon_i, где распределение \epsilon дает название модели (экспоненциальная, Вейбулла, Гомперца). Модели Вейбулла и экспоненциальная формально (экспоненциальная модель - это модель Вейбулла с параметром Scale=1) являются моделями пропорционального риска - после трансформации коэффициенты могут использоваться как отношения опасностей.

Сообщений в этой теме

nokh Допустимая доля цензурированных наблюдений в анализе выживаемости 10.03.2008 - 07:36

DrgLena Естественно, что анализ выживаемости не проводят,... 12.03.2008 - 23:55

nokh Спасибо за внимание к моей проблеме. С анализом вы... 13.03.2008 - 00:51

плав Цитата(nokh @ 13.03.2008 - 00:51) Сп... 13.03.2008 - 12:58

ВалНест Речь идет о цензурированных сулчаях, т.е. известно... 1.06.2008 - 09:16

ВалНест Цитата(nokh @ 13.03.2008 - 01:51) Сп... 1.06.2008 - 09:10

плав Цитата(ВалНест @ 1.06.2008 - 10:10) ... 3.06.2008 - 22:57

DrgLena Вы затронули очень важную тему в анализе данных. Ч... 13.03.2008 - 12:53

DrgLena Обведенная колонка у меня съехала, я хотела отмети... 13.03.2008 - 12:57

плав To DrgLena Если известно, что человек был жив чере... 13.03.2008 - 13:24

ВалНест Уважаемый ПЛАВ! У меня проблемы при сравнении ... 1.06.2008 - 08:48

DrgLena Как именно игнориорвать мне и не ясно. Условие вкл... 13.03.2008 - 14:12

DrgLena Вот пример реальный, из той же базы данных, сравни... 13.03.2008 - 14:37

плав Цитата(DrgLena @ 13.03.2008 - 14:37)... 13.03.2008 - 18:38

DrgLena График убежал, повторяю jpg 13.03.2008 - 14:40

nokh Спасибо! На свои вопросы я ответы получил. Вых... 13.03.2008 - 22:55

Igoroshka Позвольте и свои 5 копеек добавить . Усеченные (ц... 4.08.2008 - 17:58

плав Ну и каким образом это "улучшает" выжива... 5.08.2008 - 13:24

Igoroshka Цитата(плав @ 5.08.2008 - 13:24) Ну ... 5.08.2008 - 14:11

плав Цитата(Igoroshka @ 5.08.2008 - 15:11... 9.08.2008 - 20:14

Igoroshka Цитата(плав @ 9.08.2008 - 20:14) Глу... 12.08.2008 - 12:20

плав Цитата(Igoroshka @ 12.08.2008 - 13:2... 20.08.2008 - 11:10

Игорь Цитата(плав @ 9.08.2008 - 20:14) Глу... 10.08.2008 - 18:58

Игорь По информационным каналам прошло сообщение. Как ра... 1.10.2008 - 15:26

Igoroshka Цитата(Игорь @ 1.10.2008 - 15:26) По... 4.10.2008 - 09:42

nokh Еще информация к размышлению по части анализа выжи... 9.10.2008 - 21:44

Игорь Цитата(nokh @ 9.10.2008 - 22:44) Еще... 10.10.2008 - 13:19

nokh Не стал открывать новую ветку, т.к. вопрос опять п... 14.11.2008 - 08:59

плав Цитата(nokh @ 14.11.2008 - 08:59) Не... 14.11.2008 - 16:43

nokh Большое спасибо, пока все получилось красиво. Но я... 17.11.2008 - 18:28

плав Цитата(nokh @ 17.11.2008 - 18:28) Бо... 21.11.2008 - 23:13

nokh Спасибо. Получается, что если переменная бинарная,... 22.11.2008 - 18:05

DrgLena Да, если предиктор бинарный, то экспоненциальный к... 23.11.2008 - 00:56

nokh Спасибо за разъяснения. Выходит что если предиктор... 27.11.2008 - 19:21

плав Цитата(nokh @ 27.11.2008 - 19:21) 1)... 27.11.2008 - 22:17

DrgLena «Как вы это проделываете?» Да также ка... 28.11.2008 - 03:30

плав Цитата(DrgLena @ 28.11.2008 - 03:30)... 28.11.2008 - 10:29

DrgLena Мы очевидно для разных целей используем кокс регре... 28.11.2008 - 14:27

плав Цитата(DrgLena @ 28.11.2008 - 14:27)... 28.11.2008 - 17:54

DrgLena Да, мне наконец удалось, посчитать руками, помогла... 29.11.2008 - 04:11

плав Цитата(DrgLena @ 29.11.2008 - 04:11)... 1.12.2008 - 00:53

nokh Спасибо за ответы и интересную дискуссию. Использо... 30.11.2008 - 23:23

плав Цитата(nokh @ 30.11.2008 - 23:23) Сп... 1.12.2008 - 00:56

DrgLena "Все не так уж просто" Безусловно, не пр... 1.12.2008 - 02:09

плав Цитата(DrgLena @ 1.12.2008 - 02:09) ... 1.12.2008 - 21:57

Игорь Цитата(DrgLena @ 1.12.2008 - 02:09) ... 1.12.2008 - 18:37

DrgLena Я не стала бы возражать уважаемому модератору, но ... 2.12.2008 - 02:37

плав Цитата(DrgLena @ 2.12.2008 - 02:37) ... 2.12.2008 - 22:18

DrgLena Ответ уже нашла http://www.weibull.com/ 2.12.2008 - 21:37

DrgLena Плав, спасибо большое за внимание и терпение, с к... 3.12.2008 - 16:05

плав Цитата(DrgLena @ 3.12.2008 - 16:05) ... 3.12.2008 - 22:21

DrgLena Да, не используется не только кокс регрессионное м... 3.12.2008 - 23:58

« Предыдущая тема · Медицинская статистика · Следующая тема »

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум