Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Допустимая доля цензурированных наблюдений в анализе выживаемости, а что если 100%?
nokh
сообщение 10.03.2008 - 07:36
Сообщение #1





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Идеальные данные для анализа выживаемости - когда точно известно сколько человек прожил, например, после операции и когда умер. В этом случае цензурированных наблюдений нет. Другой крайний случай - когда все наблюдения цензурированные и дальнейшая судьба пациентов неизвестна. Например один прожил больше года, другой - больше трех. В этом случае может оказаться, что больше года - это 5, а больше трех - это 4. Поэтому, насколько я понимаю, сравнить выживаемость в двух группах где все наблюдения цензурированные невозможно в принципе. А какова допустимая доля цензурированных наблюдений в выборке? Существуют ли какие-то обоснованные или негласные правила? Полазил в и-нете, заглянул в книжки - пока ответа не нашел, хотя везде рассматриваются примеры где полные данные заметно преобладают над цензурированными. Или может считать цензурированными только точно живых на момент анализа, а всех потерявшихся считать умершими в интервале между двумя осмотрами, как прочитал в одной статье?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
DrgLena
сообщение 2.12.2008 - 02:37
Сообщение #2





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Я не стала бы возражать уважаемому модератору, но у меня на столе лежит первоисточник, причем на русском языке, крупного английского математика Д.Р. Кокса, который в соавторстве с Д. Оуксом в 1983 году написал эту книгу «Анализ данных типа времен жизни», у нас она вышла в 1988, и к этому времени на русском языке это уже была седьмая его книга. Цель, которой автор посвятил эту работу звучит так, ? изучить влияние различных факторов, которые в этой книге названы поясняющими переменными или ковариатами на продолжительность жизни. В 1972 году Кокс предложил математическую модель, «в рамках которой можно исследовать влияние ковариат на продолжительность жизни». Так написал сам автор метода. Почему же не исследовать. Большинство примеров и упражнения в этой книге - по расчету времени жизни. Так что цели определены.

Мне не ясно другое, какие параметры распределения я должна привести, чтобы показать, что я имею дело именно с распределением Вейбулла, чтобы не было вопросов. Значения лямбда и гамма или значение Shape ? форма и Scale - параметр масштаба? Визуально на приводимых графиках мои данные (та же выборка) согласуются с обоими этими распределениями. Хотя и с экспоненциальным тоже согласуется, но хуже. Возможно из-за большого числа наблюдений.
Поясните мне, пожалуйста, что такое задача AFTM? И что значит метод Вейбулла.
Эскизы прикрепленных изображений
Прикрепленное изображение
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 2.12.2008 - 22:18
Сообщение #3





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DrgLena @ 2.12.2008 - 02:37) *
Я не стала бы возражать уважаемому модератору, но у меня на столе лежит первоисточник, причем на русском языке, крупного английского математика Д.Р. Кокса, который в соавторстве с Д. Оуксом в 1983 году написал эту книгу «Анализ данных типа времен жизни», у нас она вышла в 1988, и к этому времени на русском языке это уже была седьмая его книга. Цель, которой автор посвятил эту работу звучит так, ? изучить влияние различных факторов, которые в этой книге названы поясняющими переменными или ковариатами на продолжительность жизни. В 1972 году Кокс предложил математическую модель, «в рамках которой можно исследовать влияние ковариат на продолжительность жизни». Так написал сам автор метода. Почему же не исследовать. Большинство примеров и упражнения в этой книге - по расчету времени жизни. Так что цели определены.

Мне не ясно другое, какие параметры распределения я должна привести, чтобы показать, что я имею дело именно с распределением Вейбулла, чтобы не было вопросов. Значения лямбда и гамма или значение Shape ? форма и Scale - параметр масштаба? Визуально на приводимых графиках мои данные (та же выборка) согласуются с обоими этими распределениями. Хотя и с экспоненциальным тоже согласуется, но хуже. Возможно из-за большого числа наблюдений.
Поясните мне, пожалуйста, что такое задача AFTM? И что значит метод Вейбулла.

Не хочется вступать в длительную дискуссию (например, какое слово переводчики переводили под слово "продолжительность жизни", если survival или hazard, то ситуация меняется кардинальным образом), напомню только вот что: в статье 1972 года Кокс предложил модель, которая была названа моделью пропорционального риска (генерализацию моделей распределения Вейбулла и Гомперца) и, одновременно, новый метод оценки модели под названием частичного правдоподобия (partial likelihood). В модели пропорционального риска риск (hazard) каждого человека определяется как часть общей опасности:
h_i(t)/h_j(t)=exp(b1*x_i-x_j)+...).
Как видно в этом уравнении базовый риск отсутствует. Он исчез при использовании модели пропорциональности риска (т.е. мы сравниваем не выживаемость, а отношения выживаемостей). Гениальность Кокса заключалась как раз в том, что он предложил метод (частичного правдоподобия), который позволял оценить регрессионные коэффициенты (b) не специфицируя фрму распределения функции опасности. Платой за использование этого метода стала некоторая потеря эффективности (при анализе коэффициентов - их стандартные ошибки чуть больше) и невозможность получить информацию о форме и характеристиках фнукции выживаемости из данных модели. Точно так же, как на основании отношения шансов невозможно восстановить ) без дополнительной информации) исходные частоты, так и на основании результатов модели Кокса невозможно оценить исходную функцию выживаемости S(t) (это, напомню, антилогарифм интеграла функции опасности от 0 до t). Настоятельно рекомендую просто разобраться в математике модели, тогда то, что я описываю станет понятным (кстати, просто попробуйте восстановить функцию h(t) на основании того, что представлено в распечатке модели и поймете, что там информации для этого нет). То, что написал Кокс абсолютно правильно, оценить влияние ковариант на функцию выживаемости (точнее опасность) можно, но восстановить саму функцию выживаемости - нет (а это в цитате и не утверждается). И я утверждал именно то же самое - модель Кокса предназначена для оценки факторов риска (т.е. сравнения функций выживаемости друг с другом, а не оценки ее значений).
Соответственно, оценивать эту функцию надо как-то по другому - и делается при помощи эмпирической функции выживаемости (точнее, опасности), которая строится по методу Каплана-Мейера. Здесь в теории все заканчивается хорошо, поскольку в теории у нас достаточно значений, чтобы точно определить форму эмпирической кривой. На практике это не так. Точность оценки эмпирической кривой в период времени t, очевидно, зависит от количества доживших до времени t (как и любой другой выборочный метод). Соответственно, если группа риска мала, то и оценка функции выживаемости будет подвержена достаточно большим выборочным колебаниям.
Вообще почти все статистические пакеты имеют в своем составе набор программ для оценки и простейшего сравнения фнукицй (кривых) выживаемости. Чаще всего функции оцениваются по методу Каплана-Мейера или методу таблиц дожития и сравниваются статистикой Вилкоксона или Пето (лог-ранг).
В моделях AFTM (accelerated failure time models) моделируется изменение функции опасности (выживаемости) под влиянием переменных
Формально выбор распределения делается на основе изучения эмпирической функции правдоподобия - если логарифм опасности (hazard) является константой, то соответствующее распределение - экспоненциальное, если линейно зависит от времени (a*t), то Гомперца, если имеет форму a*log(t), где t-время, то распределение Вейбулла. Надо помнить, что если истинное распределение - экспоненциальное, то оценка по моделям Вейбулла или Гомперца будет давать одинаковые кривые. Соответственно, задача аналитика выбрать адекватную функцию распределения и затем строить модель с использованием этой функции (приводятся графиики или используется стандратный тест соответствия теоретического и эмпирического распределений).
Уравнение AFTM чаще всего имеет следующий вид log(T_i)=a+b1*x1+b2*x2 +... \epsilon_i, где распределение \epsilon дает название модели (экспоненциальная, Вейбулла, Гомперца). Модели Вейбулла и экспоненциальная формально (экспоненциальная модель - это модель Вейбулла с параметром Scale=1) являются моделями пропорционального риска - после трансформации коэффициенты могут использоваться как отношения опасностей.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- nokh   Допустимая доля цензурированных наблюдений в анализе выживаемости   10.03.2008 - 07:36
- - DrgLena   Естественно, что анализ выживаемости не проводят,...   12.03.2008 - 23:55
- - nokh   Спасибо за внимание к моей проблеме. С анализом вы...   13.03.2008 - 00:51
|- - плав   Цитата(nokh @ 13.03.2008 - 00:51) Сп...   13.03.2008 - 12:58
||- - ВалНест   Речь идет о цензурированных сулчаях, т.е. известно...   1.06.2008 - 09:16
|- - ВалНест   Цитата(nokh @ 13.03.2008 - 01:51) Сп...   1.06.2008 - 09:10
|- - плав   Цитата(ВалНест @ 1.06.2008 - 10:10) ...   3.06.2008 - 22:57
- - DrgLena   Вы затронули очень важную тему в анализе данных. Ч...   13.03.2008 - 12:53
- - DrgLena   Обведенная колонка у меня съехала, я хотела отмети...   13.03.2008 - 12:57
- - плав   To DrgLena Если известно, что человек был жив чере...   13.03.2008 - 13:24
|- - ВалНест   Уважаемый ПЛАВ! У меня проблемы при сравнении ...   1.06.2008 - 08:48
- - DrgLena   Как именно игнориорвать мне и не ясно. Условие вкл...   13.03.2008 - 14:12
- - DrgLena   Вот пример реальный, из той же базы данных, сравни...   13.03.2008 - 14:37
|- - плав   Цитата(DrgLena @ 13.03.2008 - 14:37)...   13.03.2008 - 18:38
- - DrgLena   График убежал, повторяю jpg   13.03.2008 - 14:40
- - nokh   Спасибо! На свои вопросы я ответы получил. Вых...   13.03.2008 - 22:55
- - Igoroshka   Позвольте и свои 5 копеек добавить . Усеченные (ц...   4.08.2008 - 17:58
- - плав   Ну и каким образом это "улучшает" выжива...   5.08.2008 - 13:24
|- - Igoroshka   Цитата(плав @ 5.08.2008 - 13:24) Ну ...   5.08.2008 - 14:11
|- - плав   Цитата(Igoroshka @ 5.08.2008 - 15:11...   9.08.2008 - 20:14
|- - Igoroshka   Цитата(плав @ 9.08.2008 - 20:14) Глу...   12.08.2008 - 12:20
|- - плав   Цитата(Igoroshka @ 12.08.2008 - 13:2...   20.08.2008 - 11:10
- - Игорь   Цитата(плав @ 9.08.2008 - 20:14) Глу...   10.08.2008 - 18:58
- - Игорь   По информационным каналам прошло сообщение. Как ра...   1.10.2008 - 15:26
|- - Igoroshka   Цитата(Игорь @ 1.10.2008 - 15:26) По...   4.10.2008 - 09:42
- - nokh   Еще информация к размышлению по части анализа выжи...   9.10.2008 - 21:44
- - Игорь   Цитата(nokh @ 9.10.2008 - 22:44) Еще...   10.10.2008 - 13:19
- - nokh   Не стал открывать новую ветку, т.к. вопрос опять п...   14.11.2008 - 08:59
|- - плав   Цитата(nokh @ 14.11.2008 - 08:59) Не...   14.11.2008 - 16:43
- - nokh   Большое спасибо, пока все получилось красиво. Но я...   17.11.2008 - 18:28
|- - плав   Цитата(nokh @ 17.11.2008 - 18:28) Бо...   21.11.2008 - 23:13
- - nokh   Спасибо. Получается, что если переменная бинарная,...   22.11.2008 - 18:05
- - DrgLena   Да, если предиктор бинарный, то экспоненциальный к...   23.11.2008 - 00:56
- - nokh   Спасибо за разъяснения. Выходит что если предиктор...   27.11.2008 - 19:21
|- - плав   Цитата(nokh @ 27.11.2008 - 19:21) 1)...   27.11.2008 - 22:17
- - DrgLena   «Как вы это проделываете?» Да также ка...   28.11.2008 - 03:30
|- - плав   Цитата(DrgLena @ 28.11.2008 - 03:30)...   28.11.2008 - 10:29
- - DrgLena   Мы очевидно для разных целей используем кокс регре...   28.11.2008 - 14:27
|- - плав   Цитата(DrgLena @ 28.11.2008 - 14:27)...   28.11.2008 - 17:54
- - DrgLena   Да, мне наконец удалось, посчитать руками, помогла...   29.11.2008 - 04:11
|- - плав   Цитата(DrgLena @ 29.11.2008 - 04:11)...   1.12.2008 - 00:53
- - nokh   Спасибо за ответы и интересную дискуссию. Использо...   30.11.2008 - 23:23
|- - плав   Цитата(nokh @ 30.11.2008 - 23:23) Сп...   1.12.2008 - 00:56
- - DrgLena   "Все не так уж просто" Безусловно, не пр...   1.12.2008 - 02:09
|- - плав   Цитата(DrgLena @ 1.12.2008 - 02:09) ...   1.12.2008 - 21:57
- - Игорь   Цитата(DrgLena @ 1.12.2008 - 02:09) ...   1.12.2008 - 18:37
- - DrgLena   Я не стала бы возражать уважаемому модератору, но ...   2.12.2008 - 02:37
|- - плав   Цитата(DrgLena @ 2.12.2008 - 02:37) ...   2.12.2008 - 22:18
- - DrgLena   Ответ уже нашла http://www.weibull.com/   2.12.2008 - 21:37
- - DrgLena   Плав, спасибо большое за внимание и терпение, с к...   3.12.2008 - 16:05
|- - плав   Цитата(DrgLena @ 3.12.2008 - 16:05) ...   3.12.2008 - 22:21
- - DrgLena   Да, не используется не только кокс регрессионное м...   3.12.2008 - 23:58


Добавить ответ в эту темуОткрыть тему