![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Идеальные данные для анализа выживаемости - когда точно известно сколько человек прожил, например, после операции и когда умер. В этом случае цензурированных наблюдений нет. Другой крайний случай - когда все наблюдения цензурированные и дальнейшая судьба пациентов неизвестна. Например один прожил больше года, другой - больше трех. В этом случае может оказаться, что больше года - это 5, а больше трех - это 4. Поэтому, насколько я понимаю, сравнить выживаемость в двух группах где все наблюдения цензурированные невозможно в принципе. А какова допустимая доля цензурированных наблюдений в выборке? Существуют ли какие-то обоснованные или негласные правила? Полазил в и-нете, заглянул в книжки - пока ответа не нашел, хотя везде рассматриваются примеры где полные данные заметно преобладают над цензурированными. Или может считать цензурированными только точно живых на момент анализа, а всех потерявшихся считать умершими в интервале между двумя осмотрами, как прочитал в одной статье?
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 ![]() |
Мы очевидно для разных целей используем кокс регрессию. Мне не нужно сравнивать факторы между собой, мне нужно построить функцию выживания в зависимости от значения, например этих двух факторов - курение и АД. Понятно, что у курильщиков риск в 2,5 раза выше, чем у не курильщиков, а также повышение на 1 (n+1) АД повышает риск на 6% относительно n. А ваши стандартизированные HR мне такой информации не дают. Вопрос в другом, относительно какого значения АД, начинается отсчет повышение риска? Например, оба не курят, у одного верхнее давление 100, у другого 105, будет ли у второго риск выше на 30% выше, чем у первого. Вот тут наконец мы и приходим к формуле кокс регрессии и объясняем, что такое «базовый риск» h0(t), Боровиков написал, что это значение функции отказа при нулевом значении всех предикторов. Очевидно, он взял эту фразу из документации к программа Statistica. Он только не уточнил, что это средние стандартизированные значения. Т.о. по средним значениям строится функция отказов. Тогда, при переходе на реальные данные среднее давление в выборке по которой строилась модель , например, 155, тогда повышение давления до 160 повышает риск на 30% по сравнению с 155.
Именно поэтому после процедуры кокс регрессии программы, например SPSS или Statistica выдают средние значения предикторов в обучающей выборке. И из этих средних значений во многих публикациях делают бинарные переменные. Возраст >63 лет, высота опухоли >7,2 мм ? это фактор риска, альтернатива ? меньше этих значений. Насколько я поняла, мы оцениваем риск каждого больного относительно этого базового риска. При этом, я привожу кривую базового риска и на этом же графике для конкретного больного. Но ?.получить ручками из реальных коэффициентов (не exp) я не смогла. Если можно, покажите, как их использовать для ответа на вопрос какова вероятность 5 летнего выживания при давлении 160 у курильщика. Или на более понятной реальной задаче. в пришпиленном файле
Прикрепленные файлы
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Мы очевидно для разных целей используем кокс регрессию. Мне не нужно сравнивать факторы между собой, мне нужно построить функцию выживания в зависимости от значения, например этих двух факторов - курение и АД. Понятно, что у курильщиков риск в 2,5 раза выше, чем у не курильщиков, а также повышение на 1 (n+1) АД повышает риск на 6% относительно n. А ваши стандартизированные HR мне такой информации не дают. Вопрос в другом, относительно какого значения АД, начинается отсчет повышение риска? Например, оба не курят, у одного верхнее давление 100, у другого 105, будет ли у второго риск выше на 30% выше, чем у первого. Вот тут наконец мы и приходим к формуле кокс регрессии и объясняем, что такое «базовый риск» h0(t), Боровиков написал, что это значение функции отказа при нулевом значении всех предикторов. Очевидно, он взял эту фразу из документации к программа Statistica. Он только не уточнил, что это средние стандартизированные значения. Т.о. по средним значениям строится функция отказов. Тогда, при переходе на реальные данные среднее давление в выборке по которой строилась модель , например, 155, тогда повышение давления до 160 повышает риск на 30% по сравнению с 155. Именно поэтому после процедуры кокс регрессии программы, например SPSS или Statistica выдают средние значения предикторов в обучающей выборке. И из этих средних значений во многих публикациях делают бинарные переменные. Возраст >63 лет, высота опухоли >7,2 мм ? это фактор риска, альтернатива ? меньше этих значений. Насколько я поняла, мы оцениваем риск каждого больного относительно этого базового риска. При этом, я привожу кривую базового риска и на этом же графике для конкретного больного. Но ?.получить ручками из реальных коэффициентов (не exp) я не смогла. Если можно, покажите, как их использовать для ответа на вопрос какова вероятность 5 летнего выживания при давлении 160 у курильщика. Или на более понятной реальной задаче. в пришпиленном файле Если ответить коротко - никак. Регрессия по Коксу как раз была разработана для тех случаев, когда нет представления о форме функции выживаемости. Иными словами при анализе модели пропорционального риска кривая выживаемости из рассмотрения удаляется и рассматриваются только ее изменения при разном уровне предикторов. Иными словами, модель была разработана как раз для сравнения факторов риска и оценки их влияния на эмпирическую фнукцию выживания. Соответственно, что делают большинство людей (и программ). Они оценивают эмпирическую функцию выживаемости (т.е. это будет функция для средних значений предикторов), а затем модифицируют ее на основе полученных значений HR. Соответственно, единственный способ получния вероятности выживания пациента - построение (откорректированной) кривой выживаемости (на основе эмпирической) и затем анализ полученного графика. Иными лсоавми, работаем так же, как и кривой Каплана-Мейера (собственно, она и используется для оценки эмпирической функции). Соответственно, можно анализировать только данные за период наблюдения (если смертность меньше 50%, продолжительность жизни уже не оценить). В реальности если надо анализировать не значимость факторов риска, а выживаемость, то надо использовать не модель пропорционального риска, а параметрические модели (AFTM - accelaretd failure-time model) такие, как модель Вейбулла - придется делать предположения о форме распределения времен дожития. Там - по параметрам модели - уже можно оценивать и вероятность дожития до определенного периода, и продолжительность жизни и т.д. |
|
![]() |
![]() |
![]() ![]() |