![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Идеальные данные для анализа выживаемости - когда точно известно сколько человек прожил, например, после операции и когда умер. В этом случае цензурированных наблюдений нет. Другой крайний случай - когда все наблюдения цензурированные и дальнейшая судьба пациентов неизвестна. Например один прожил больше года, другой - больше трех. В этом случае может оказаться, что больше года - это 5, а больше трех - это 4. Поэтому, насколько я понимаю, сравнить выживаемость в двух группах где все наблюдения цензурированные невозможно в принципе. А какова допустимая доля цензурированных наблюдений в выборке? Существуют ли какие-то обоснованные или негласные правила? Полазил в и-нете, заглянул в книжки - пока ответа не нашел, хотя везде рассматриваются примеры где полные данные заметно преобладают над цензурированными. Или может считать цензурированными только точно живых на момент анализа, а всех потерявшихся считать умершими в интервале между двумя осмотрами, как прочитал в одной статье?
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 ![]() |
Я не стала бы возражать уважаемому модератору, но у меня на столе лежит первоисточник, причем на русском языке, крупного английского математика Д.Р. Кокса, который в соавторстве с Д. Оуксом в 1983 году написал эту книгу «Анализ данных типа времен жизни», у нас она вышла в 1988, и к этому времени на русском языке это уже была седьмая его книга. Цель, которой автор посвятил эту работу звучит так, ? изучить влияние различных факторов, которые в этой книге названы поясняющими переменными или ковариатами на продолжительность жизни. В 1972 году Кокс предложил математическую модель, «в рамках которой можно исследовать влияние ковариат на продолжительность жизни». Так написал сам автор метода. Почему же не исследовать. Большинство примеров и упражнения в этой книге - по расчету времени жизни. Так что цели определены.
Мне не ясно другое, какие параметры распределения я должна привести, чтобы показать, что я имею дело именно с распределением Вейбулла, чтобы не было вопросов. Значения лямбда и гамма или значение Shape ? форма и Scale - параметр масштаба? Визуально на приводимых графиках мои данные (та же выборка) согласуются с обоими этими распределениями. Хотя и с экспоненциальным тоже согласуется, но хуже. Возможно из-за большого числа наблюдений. Поясните мне, пожалуйста, что такое задача AFTM? И что значит метод Вейбулла. |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Я не стала бы возражать уважаемому модератору, но у меня на столе лежит первоисточник, причем на русском языке, крупного английского математика Д.Р. Кокса, который в соавторстве с Д. Оуксом в 1983 году написал эту книгу «Анализ данных типа времен жизни», у нас она вышла в 1988, и к этому времени на русском языке это уже была седьмая его книга. Цель, которой автор посвятил эту работу звучит так, ? изучить влияние различных факторов, которые в этой книге названы поясняющими переменными или ковариатами на продолжительность жизни. В 1972 году Кокс предложил математическую модель, «в рамках которой можно исследовать влияние ковариат на продолжительность жизни». Так написал сам автор метода. Почему же не исследовать. Большинство примеров и упражнения в этой книге - по расчету времени жизни. Так что цели определены. Мне не ясно другое, какие параметры распределения я должна привести, чтобы показать, что я имею дело именно с распределением Вейбулла, чтобы не было вопросов. Значения лямбда и гамма или значение Shape ? форма и Scale - параметр масштаба? Визуально на приводимых графиках мои данные (та же выборка) согласуются с обоими этими распределениями. Хотя и с экспоненциальным тоже согласуется, но хуже. Возможно из-за большого числа наблюдений. Поясните мне, пожалуйста, что такое задача AFTM? И что значит метод Вейбулла. Не хочется вступать в длительную дискуссию (например, какое слово переводчики переводили под слово "продолжительность жизни", если survival или hazard, то ситуация меняется кардинальным образом), напомню только вот что: в статье 1972 года Кокс предложил модель, которая была названа моделью пропорционального риска (генерализацию моделей распределения Вейбулла и Гомперца) и, одновременно, новый метод оценки модели под названием частичного правдоподобия (partial likelihood). В модели пропорционального риска риск (hazard) каждого человека определяется как часть общей опасности: h_i(t)/h_j(t)=exp(b1*x_i-x_j)+...). Как видно в этом уравнении базовый риск отсутствует. Он исчез при использовании модели пропорциональности риска (т.е. мы сравниваем не выживаемость, а отношения выживаемостей). Гениальность Кокса заключалась как раз в том, что он предложил метод (частичного правдоподобия), который позволял оценить регрессионные коэффициенты (b) не специфицируя фрму распределения функции опасности. Платой за использование этого метода стала некоторая потеря эффективности (при анализе коэффициентов - их стандартные ошибки чуть больше) и невозможность получить информацию о форме и характеристиках фнукции выживаемости из данных модели. Точно так же, как на основании отношения шансов невозможно восстановить ) без дополнительной информации) исходные частоты, так и на основании результатов модели Кокса невозможно оценить исходную функцию выживаемости S(t) (это, напомню, антилогарифм интеграла функции опасности от 0 до t). Настоятельно рекомендую просто разобраться в математике модели, тогда то, что я описываю станет понятным (кстати, просто попробуйте восстановить функцию h(t) на основании того, что представлено в распечатке модели и поймете, что там информации для этого нет). То, что написал Кокс абсолютно правильно, оценить влияние ковариант на функцию выживаемости (точнее опасность) можно, но восстановить саму функцию выживаемости - нет (а это в цитате и не утверждается). И я утверждал именно то же самое - модель Кокса предназначена для оценки факторов риска (т.е. сравнения функций выживаемости друг с другом, а не оценки ее значений). Соответственно, оценивать эту функцию надо как-то по другому - и делается при помощи эмпирической функции выживаемости (точнее, опасности), которая строится по методу Каплана-Мейера. Здесь в теории все заканчивается хорошо, поскольку в теории у нас достаточно значений, чтобы точно определить форму эмпирической кривой. На практике это не так. Точность оценки эмпирической кривой в период времени t, очевидно, зависит от количества доживших до времени t (как и любой другой выборочный метод). Соответственно, если группа риска мала, то и оценка функции выживаемости будет подвержена достаточно большим выборочным колебаниям. Вообще почти все статистические пакеты имеют в своем составе набор программ для оценки и простейшего сравнения фнукицй (кривых) выживаемости. Чаще всего функции оцениваются по методу Каплана-Мейера или методу таблиц дожития и сравниваются статистикой Вилкоксона или Пето (лог-ранг). В моделях AFTM (accelerated failure time models) моделируется изменение функции опасности (выживаемости) под влиянием переменных Формально выбор распределения делается на основе изучения эмпирической функции правдоподобия - если логарифм опасности (hazard) является константой, то соответствующее распределение - экспоненциальное, если линейно зависит от времени (a*t), то Гомперца, если имеет форму a*log(t), где t-время, то распределение Вейбулла. Надо помнить, что если истинное распределение - экспоненциальное, то оценка по моделям Вейбулла или Гомперца будет давать одинаковые кривые. Соответственно, задача аналитика выбрать адекватную функцию распределения и затем строить модель с использованием этой функции (приводятся графиики или используется стандратный тест соответствия теоретического и эмпирического распределений). Уравнение AFTM чаще всего имеет следующий вид log(T_i)=a+b1*x1+b2*x2 +... \epsilon_i, где распределение \epsilon дает название модели (экспоненциальная, Вейбулла, Гомперца). Модели Вейбулла и экспоненциальная формально (экспоненциальная модель - это модель Вейбулла с параметром Scale=1) являются моделями пропорционального риска - после трансформации коэффициенты могут использоваться как отношения опасностей. |
|
![]() |
![]() |
![]() ![]() |