Допустимая доля цензурированных наблюдений в анализе выживаемости

Допустимая доля цензурированных наблюдений в анализе выживаемости, а что если 100%?

плав Просмотр профиля	1.12.2008 - 21:57 Сообщение #46
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Цитата(DrgLena @ 1.12.2008 - 02:09) "Насчет плохих привычек, я вообще не поняла?., что с чем совмещали раньше. Грустно только, что прогнозы сбываются и в контрольной выборке. Это я имел ввиду, что модель пропорционального риска не предназначена для оценки функции выживаемости. Она получает коэффициенты, повышающие или понижающие риск, а затем используется эмпирическая фнукция выживаемости Каплана-Мейера, которая и меняется в соответствии с коэффициентами модели пропорционального риска. Оценка функции выживаемости - это задача AFTM (той самой модели Вейбулла), однако она должна иметь определенный теоретический вид. Соответственно, писать, что "функцию выживаемости оценивали по модели Кокса" - неправильно, ибо она ее не оценивает. Макисмум, что можно написать - "функцию выживаемости анализировали при помощи коррекции эмпирической функции выживаемости (КМ) коэффициентами модели пропорционального риска". Что же касается численности, то сколько бы ни было вначале, важно на основании какого количества пациентов проводится расчет эмпирической функции в правом углу графика. Если, скажем, было 2000 человек, но 1990 умерли в первый год, а оставшиеся 10 медленно вымирали следующие 5 лет, то считать эмпирическую функцию выживаемости адекватной больше, чем через год после начала исследования нельзя. С AFTM все проще. Поскольку для оценки параметров используется весь массив данных, то фнукция выживаемости справедлива для всего диапазона данных (надо только подбирать распределения, для примера выше это явно не экспонента и не вейбулл, скорее распределение Гомперца - оно позволяет моделировать эффект выздоровления). Вообщем все, что я хотел сказать, это то, что модель Кокса должна использоваться для того, для чего она была разработана - анализ и сравнение факторов риска, а не для того, для чего она не разрабатывалась (изучение функции выживаемости).

DrgLena

2.12.2008 - 02:37

Сообщение #47

Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573

Я не стала бы возражать уважаемому модератору, но у меня на столе лежит первоисточник, причем на русском языке, крупного английского математика Д.Р. Кокса, который в соавторстве с Д. Оуксом в 1983 году написал эту книгу «Анализ данных типа времен жизни», у нас она вышла в 1988, и к этому времени на русском языке это уже была седьмая его книга. Цель, которой автор посвятил эту работу звучит так, ? изучить влияние различных факторов, которые в этой книге названы поясняющими переменными или ковариатами на продолжительность жизни. В 1972 году Кокс предложил математическую модель, «в рамках которой можно исследовать влияние ковариат на продолжительность жизни». Так написал сам автор метода. Почему же не исследовать. Большинство примеров и упражнения в этой книге - по расчету времени жизни. Так что цели определены.

Мне не ясно другое, какие параметры распределения я должна привести, чтобы показать, что я имею дело именно с распределением Вейбулла, чтобы не было вопросов. Значения лямбда и гамма или значение Shape ? форма и Scale - параметр масштаба? Визуально на приводимых графиках мои данные (та же выборка) согласуются с обоими этими распределениями. Хотя и с экспоненциальным тоже согласуется, но хуже. Возможно из-за большого числа наблюдений.
Поясните мне, пожалуйста, что такое задача AFTM? И что значит метод Вейбулла.

Эскизы прикрепленных изображений

Ответить с цитированием данного сообщения

DrgLena Просмотр профиля	2.12.2008 - 21:37 Сообщение #48
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Ответ уже нашла http://www.weibull.com/

плав Просмотр профиля	2.12.2008 - 22:18 Сообщение #49
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Цитата(DrgLena @ 2.12.2008 - 02:37) Я не стала бы возражать уважаемому модератору, но у меня на столе лежит первоисточник, причем на русском языке, крупного английского математика Д.Р. Кокса, который в соавторстве с Д. Оуксом в 1983 году написал эту книгу «Анализ данных типа времен жизни», у нас она вышла в 1988, и к этому времени на русском языке это уже была седьмая его книга. Цель, которой автор посвятил эту работу звучит так, ? изучить влияние различных факторов, которые в этой книге названы поясняющими переменными или ковариатами на продолжительность жизни. В 1972 году Кокс предложил математическую модель, «в рамках которой можно исследовать влияние ковариат на продолжительность жизни». Так написал сам автор метода. Почему же не исследовать. Большинство примеров и упражнения в этой книге - по расчету времени жизни. Так что цели определены. Мне не ясно другое, какие параметры распределения я должна привести, чтобы показать, что я имею дело именно с распределением Вейбулла, чтобы не было вопросов. Значения лямбда и гамма или значение Shape ? форма и Scale - параметр масштаба? Визуально на приводимых графиках мои данные (та же выборка) согласуются с обоими этими распределениями. Хотя и с экспоненциальным тоже согласуется, но хуже. Возможно из-за большого числа наблюдений. Поясните мне, пожалуйста, что такое задача AFTM? И что значит метод Вейбулла. Не хочется вступать в длительную дискуссию (например, какое слово переводчики переводили под слово "продолжительность жизни", если survival или hazard, то ситуация меняется кардинальным образом), напомню только вот что: в статье 1972 года Кокс предложил модель, которая была названа моделью пропорционального риска (генерализацию моделей распределения Вейбулла и Гомперца) и, одновременно, новый метод оценки модели под названием частичного правдоподобия (partial likelihood). В модели пропорционального риска риск (hazard) каждого человека определяется как часть общей опасности: h_i(t)/h_j(t)=exp(b1x_i-x_j)+...). Как видно в этом уравнении базовый риск отсутствует. Он исчез при использовании модели пропорциональности риска (т.е. мы сравниваем не выживаемость, а отношения выживаемостей). Гениальность Кокса заключалась как раз в том, что он предложил метод (частичного правдоподобия), который позволял оценить регрессионные коэффициенты (b) не специфицируя фрму распределения функции опасности. Платой за использование этого метода стала некоторая потеря эффективности (при анализе коэффициентов - их стандартные ошибки чуть больше) и невозможность получить информацию о форме и характеристиках фнукции выживаемости из данных модели. Точно так же, как на основании отношения шансов невозможно восстановить ) без дополнительной информации) исходные частоты, так и на основании результатов модели Кокса невозможно оценить исходную функцию выживаемости S(t) (это, напомню, антилогарифм интеграла функции опасности от 0 до t). Настоятельно рекомендую просто разобраться в математике модели, тогда то, что я описываю станет понятным (кстати, просто попробуйте восстановить функцию h(t) на основании того, что представлено в распечатке модели и поймете, что там информации для этого нет). То, что написал Кокс абсолютно правильно, оценить влияние ковариант на функцию выживаемости (точнее опасность) можно, но восстановить саму функцию выживаемости - нет (а это в цитате и не утверждается). И я утверждал именно то же самое - модель Кокса предназначена для оценки факторов риска (т.е. сравнения функций выживаемости друг с другом, а не оценки ее значений). Соответственно, оценивать эту функцию надо как-то по другому - и делается при помощи эмпирической функции выживаемости (точнее, опасности), которая строится по методу Каплана-Мейера. Здесь в теории все заканчивается хорошо, поскольку в теории у нас достаточно значений, чтобы точно определить форму эмпирической кривой. На практике это не так. Точность оценки эмпирической кривой в период времени t, очевидно, зависит от количества доживших до времени t (как и любой другой выборочный метод). Соответственно, если группа риска мала, то и оценка функции выживаемости будет подвержена достаточно большим выборочным колебаниям. Вообще почти все статистические пакеты имеют в своем составе набор программ для оценки и простейшего сравнения фнукицй (кривых) выживаемости. Чаще всего функции оцениваются по методу Каплана-Мейера или методу таблиц дожития и сравниваются статистикой Вилкоксона или Пето (лог-ранг). В моделях AFTM (accelerated failure time models) моделируется изменение функции опасности (выживаемости) под влиянием переменных Формально выбор распределения делается на основе изучения эмпирической функции правдоподобия - если логарифм опасности (hazard) является константой, то соответствующее распределение - экспоненциальное, если линейно зависит от времени (at), то Гомперца, если имеет форму alog(t), где t-время, то распределение Вейбулла. Надо помнить, что если истинное распределение - экспоненциальное, то оценка по моделям Вейбулла или Гомперца будет давать одинаковые кривые. Соответственно, задача аналитика выбрать адекватную функцию распределения и затем строить модель с использованием этой функции (приводятся графиики или используется стандратный тест соответствия теоретического и эмпирического распределений). Уравнение AFTM чаще всего имеет следующий вид log(T_i)=a+b1x1+b2*x2 +... \epsilon_i, где распределение \epsilon дает название модели (экспоненциальная, Вейбулла, Гомперца). Модели Вейбулла и экспоненциальная формально (экспоненциальная модель - это модель Вейбулла с параметром Scale=1) являются моделями пропорционального риска - после трансформации коэффициенты могут использоваться как отношения опасностей.

DrgLena Просмотр профиля	3.12.2008 - 16:05 Сообщение #50
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Плав, спасибо большое за внимание и терпение, с которым вам удается находить необходимые слова и деликатный тон общения с людьми разного уровня подготовки. Вы оказываете реальную помощь людям, которые самостоятельно пытаются разобраться в большом количестве информации в столь интересной области знаний. Именно с формулой я и пытаюсь разобраться, вы пишете? В модели пропорционального риска риск (hazard) каждого человека определяется как часть общей опасности: h_i(t)/h_j(t)=exp(b1*x_i-x_j)+...). Я же вижу в формулах из разных источников, которые я приводила, что риск для каждого человека, не часть общей опасности, а отношение его риска и базовому, т.е. к среднему в выборке по которой модель построена. И если умножить обе части на h_j(t), то это и будет его риск. Эту ветку по кокс регрессии не я начала и интерес к ней скромный, мало кто использует этот метод анализа, но я благодаря вашим постам нашла в Statistica весьма полезный модуль, Process Analysis, с прекрасными графическими возможностями, получила и параметр формы и параметр масштаба, а также нашла лучший параметр положения (location), поскольку распределение Вейбулла ограничено слева. Спасибо!!!

плав Просмотр профиля	3.12.2008 - 22:21 Сообщение #51
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Цитата(DrgLena @ 3.12.2008 - 16:05) Плав, спасибо большое за внимание и терпение, с которым вам удается находить необходимые слова и деликатный тон общения с людьми разного уровня подготовки. Вы оказываете реальную помощь людям, которые самостоятельно пытаются разобраться в большом количестве информации в столь интересной области знаний. Именно с формулой я и пытаюсь разобраться, вы пишете? В модели пропорционального риска риск (hazard) каждого человека определяется как часть общей опасности: h_i(t)/h_j(t)=exp(b1x_i-x_j)+...). Я же вижу в формулах из разных источников, которые я приводила, что риск для каждого человека, не часть общей опасности, а отношение его риска и базовому, т.е. к среднему в выборке по которой модель построена. И если умножить обе части на h_j(t), то это и будет его риск. Эту ветку по кокс регрессии не я начала и интерес к ней скромный, мало кто использует этот метод анализа, но я благодаря вашим постам нашла в Statistica весьма полезный модуль, Process Analysis, с прекрасными графическими возможностями, получила и параметр формы и параметр масштаба, а также нашла лучший параметр положения (location), поскольку распределение Вейбулла ограничено слева. Спасибо!!! Да, формула такая, как я привел. То, что обычно приводится - (h_i(t)=h(t)...) это просто модель пропорционального риска, а не модель Кокса (как, например, модель Вейбулла). Но тогда, поскольку h(t) в правой части, надо ее описать. А для эмпирической кривой, каждое значение - отдельная точка. Соответственно для оценки h(t) будем использовать уже все точки и степеней свободы (точек, наблюдений) для оценки влияния факторов риска не будет. Альтернативой является описать функицю риска каким-то параметрическим уравнением (например, распределением Вейбулла) - у него всего два (три) параметра. Тогда останется и на оценку факторов риска. А и то и другое вместе - никак. Кокс же предложил анализ, который позволял вообще обойтись без оценки h(t), путем того, что вместо опасности анализировалось отношение опасностей, а уж h_i(t) можно было найти проанализировав влияние факторов риска и построив эмпирическую кривую (со всеми вытекающими проблемами в правой части). А вообще-то жалко, что методом (у нас) пользуются мало - он мощный, красивый и более информативный, чем, например, логистическая регрессия (но надо иметь время до события, а при принятом у нас "ретроспективном" сборе материла...)

DrgLena Просмотр профиля	3.12.2008 - 23:58 Сообщение #52
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Да, не используется не только кокс регрессионное моделирование, но даже таблицы дожития или КМ оценки не проводятся. В результате публикуются парадоксально завышенные показатели пятилетней выживаемости, которые вызывают недоверие к нашим результатам со стороны зарубежных исследователей. Еще в советское время существовавали метод рекомендации ленинградского института онкологии, с нарисованными тремя ящичками, куда нужно было складывать карточки - жив, умер, нет данных (на конкретный срок наблюдения). Множительные оценки там были описаны, хотя и не назывались Каплан-Мейера. Сегодня с приходом компьютеров не составляет труда занести данные при постановке диагноза и в последующем, иметь контроль за состоянием пациента, рассылая письма с приглашением для контрольного осмотра, определять при этом и его жизненный статус. Но это явно ни диссертабельная работа....

« Предыдущая тема · Медицинская статистика · Следующая тема »