Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Допустимая доля цензурированных наблюдений в анализе выживаемости, а что если 100%?
nokh
сообщение 10.03.2008 - 07:36
Сообщение #1





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Идеальные данные для анализа выживаемости - когда точно известно сколько человек прожил, например, после операции и когда умер. В этом случае цензурированных наблюдений нет. Другой крайний случай - когда все наблюдения цензурированные и дальнейшая судьба пациентов неизвестна. Например один прожил больше года, другой - больше трех. В этом случае может оказаться, что больше года - это 5, а больше трех - это 4. Поэтому, насколько я понимаю, сравнить выживаемость в двух группах где все наблюдения цензурированные невозможно в принципе. А какова допустимая доля цензурированных наблюдений в выборке? Существуют ли какие-то обоснованные или негласные правила? Полазил в и-нете, заглянул в книжки - пока ответа не нашел, хотя везде рассматриваются примеры где полные данные заметно преобладают над цензурированными. Или может считать цензурированными только точно живых на момент анализа, а всех потерявшихся считать умершими в интервале между двумя осмотрами, как прочитал в одной статье?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
DrgLena
сообщение 28.11.2008 - 14:27
Сообщение #2





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Мы очевидно для разных целей используем кокс регрессию. Мне не нужно сравнивать факторы между собой, мне нужно построить функцию выживания в зависимости от значения, например этих двух факторов - курение и АД. Понятно, что у курильщиков риск в 2,5 раза выше, чем у не курильщиков, а также повышение на 1 (n+1) АД повышает риск на 6% относительно n. А ваши стандартизированные HR мне такой информации не дают. Вопрос в другом, относительно какого значения АД, начинается отсчет повышение риска? Например, оба не курят, у одного верхнее давление 100, у другого 105, будет ли у второго риск выше на 30% выше, чем у первого. Вот тут наконец мы и приходим к формуле кокс регрессии и объясняем, что такое «базовый риск» h0(t), Боровиков написал, что это значение функции отказа при нулевом значении всех предикторов. Очевидно, он взял эту фразу из документации к программа Statistica. Он только не уточнил, что это средние стандартизированные значения. Т.о. по средним значениям строится функция отказов. Тогда, при переходе на реальные данные среднее давление в выборке по которой строилась модель , например, 155, тогда повышение давления до 160 повышает риск на 30% по сравнению с 155.
Именно поэтому после процедуры кокс регрессии программы, например SPSS или Statistica выдают средние значения предикторов в обучающей выборке. И из этих средних значений во многих публикациях делают бинарные переменные. Возраст >63 лет, высота опухоли >7,2 мм ? это фактор риска, альтернатива ? меньше этих значений. Насколько я поняла, мы оцениваем риск каждого больного относительно этого базового риска. При этом, я привожу кривую базового риска и на этом же графике для конкретного больного.
Но ?.получить ручками из реальных коэффициентов (не exp) я не смогла. Если можно, покажите, как их использовать для ответа на вопрос какова вероятность 5 летнего выживания при давлении 160 у курильщика. Или на более понятной реальной задаче. в пришпиленном файле

Прикрепленные файлы
Прикрепленный файл  va.ppt ( 564,5 килобайт ) Кол-во скачиваний: 502
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 28.11.2008 - 17:54
Сообщение #3





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DrgLena @ 28.11.2008 - 14:27) *
Мы очевидно для разных целей используем кокс регрессию. Мне не нужно сравнивать факторы между собой, мне нужно построить функцию выживания в зависимости от значения, например этих двух факторов - курение и АД. Понятно, что у курильщиков риск в 2,5 раза выше, чем у не курильщиков, а также повышение на 1 (n+1) АД повышает риск на 6% относительно n. А ваши стандартизированные HR мне такой информации не дают. Вопрос в другом, относительно какого значения АД, начинается отсчет повышение риска? Например, оба не курят, у одного верхнее давление 100, у другого 105, будет ли у второго риск выше на 30% выше, чем у первого. Вот тут наконец мы и приходим к формуле кокс регрессии и объясняем, что такое «базовый риск» h0(t), Боровиков написал, что это значение функции отказа при нулевом значении всех предикторов. Очевидно, он взял эту фразу из документации к программа Statistica. Он только не уточнил, что это средние стандартизированные значения. Т.о. по средним значениям строится функция отказов. Тогда, при переходе на реальные данные среднее давление в выборке по которой строилась модель , например, 155, тогда повышение давления до 160 повышает риск на 30% по сравнению с 155.
Именно поэтому после процедуры кокс регрессии программы, например SPSS или Statistica выдают средние значения предикторов в обучающей выборке. И из этих средних значений во многих публикациях делают бинарные переменные. Возраст >63 лет, высота опухоли >7,2 мм ? это фактор риска, альтернатива ? меньше этих значений. Насколько я поняла, мы оцениваем риск каждого больного относительно этого базового риска. При этом, я привожу кривую базового риска и на этом же графике для конкретного больного.
Но ?.получить ручками из реальных коэффициентов (не exp) я не смогла. Если можно, покажите, как их использовать для ответа на вопрос какова вероятность 5 летнего выживания при давлении 160 у курильщика. Или на более понятной реальной задаче. в пришпиленном файле

Если ответить коротко - никак. Регрессия по Коксу как раз была разработана для тех случаев, когда нет представления о форме функции выживаемости. Иными словами при анализе модели пропорционального риска кривая выживаемости из рассмотрения удаляется и рассматриваются только ее изменения при разном уровне предикторов. Иными словами, модель была разработана как раз для сравнения факторов риска и оценки их влияния на эмпирическую фнукцию выживания. Соответственно, что делают большинство людей (и программ). Они оценивают эмпирическую функцию выживаемости (т.е. это будет функция для средних значений предикторов), а затем модифицируют ее на основе полученных значений HR. Соответственно, единственный способ получния вероятности выживания пациента - построение (откорректированной) кривой выживаемости (на основе эмпирической) и затем анализ полученного графика. Иными лсоавми, работаем так же, как и кривой Каплана-Мейера (собственно, она и используется для оценки эмпирической функции). Соответственно, можно анализировать только данные за период наблюдения (если смертность меньше 50%, продолжительность жизни уже не оценить).
В реальности если надо анализировать не значимость факторов риска, а выживаемость, то надо использовать не модель пропорционального риска, а параметрические модели (AFTM - accelaretd failure-time model) такие, как модель Вейбулла - придется делать предположения о форме распределения времен дожития. Там - по параметрам модели - уже можно оценивать и вероятность дожития до определенного периода, и продолжительность жизни и т.д.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- nokh   Допустимая доля цензурированных наблюдений в анализе выживаемости   10.03.2008 - 07:36
- - DrgLena   Естественно, что анализ выживаемости не проводят,...   12.03.2008 - 23:55
- - nokh   Спасибо за внимание к моей проблеме. С анализом вы...   13.03.2008 - 00:51
|- - плав   Цитата(nokh @ 13.03.2008 - 00:51) Сп...   13.03.2008 - 12:58
||- - ВалНест   Речь идет о цензурированных сулчаях, т.е. известно...   1.06.2008 - 09:16
|- - ВалНест   Цитата(nokh @ 13.03.2008 - 01:51) Сп...   1.06.2008 - 09:10
|- - плав   Цитата(ВалНест @ 1.06.2008 - 10:10) ...   3.06.2008 - 22:57
- - DrgLena   Вы затронули очень важную тему в анализе данных. Ч...   13.03.2008 - 12:53
- - DrgLena   Обведенная колонка у меня съехала, я хотела отмети...   13.03.2008 - 12:57
- - плав   To DrgLena Если известно, что человек был жив чере...   13.03.2008 - 13:24
|- - ВалНест   Уважаемый ПЛАВ! У меня проблемы при сравнении ...   1.06.2008 - 08:48
- - DrgLena   Как именно игнориорвать мне и не ясно. Условие вкл...   13.03.2008 - 14:12
- - DrgLena   Вот пример реальный, из той же базы данных, сравни...   13.03.2008 - 14:37
|- - плав   Цитата(DrgLena @ 13.03.2008 - 14:37)...   13.03.2008 - 18:38
- - DrgLena   График убежал, повторяю jpg   13.03.2008 - 14:40
- - nokh   Спасибо! На свои вопросы я ответы получил. Вых...   13.03.2008 - 22:55
- - Igoroshka   Позвольте и свои 5 копеек добавить . Усеченные (ц...   4.08.2008 - 17:58
- - плав   Ну и каким образом это "улучшает" выжива...   5.08.2008 - 13:24
|- - Igoroshka   Цитата(плав @ 5.08.2008 - 13:24) Ну ...   5.08.2008 - 14:11
|- - плав   Цитата(Igoroshka @ 5.08.2008 - 15:11...   9.08.2008 - 20:14
|- - Igoroshka   Цитата(плав @ 9.08.2008 - 20:14) Глу...   12.08.2008 - 12:20
|- - плав   Цитата(Igoroshka @ 12.08.2008 - 13:2...   20.08.2008 - 11:10
- - Игорь   Цитата(плав @ 9.08.2008 - 20:14) Глу...   10.08.2008 - 18:58
- - Игорь   По информационным каналам прошло сообщение. Как ра...   1.10.2008 - 15:26
|- - Igoroshka   Цитата(Игорь @ 1.10.2008 - 15:26) По...   4.10.2008 - 09:42
- - nokh   Еще информация к размышлению по части анализа выжи...   9.10.2008 - 21:44
- - Игорь   Цитата(nokh @ 9.10.2008 - 22:44) Еще...   10.10.2008 - 13:19
- - nokh   Не стал открывать новую ветку, т.к. вопрос опять п...   14.11.2008 - 08:59
|- - плав   Цитата(nokh @ 14.11.2008 - 08:59) Не...   14.11.2008 - 16:43
- - nokh   Большое спасибо, пока все получилось красиво. Но я...   17.11.2008 - 18:28
|- - плав   Цитата(nokh @ 17.11.2008 - 18:28) Бо...   21.11.2008 - 23:13
- - nokh   Спасибо. Получается, что если переменная бинарная,...   22.11.2008 - 18:05
- - DrgLena   Да, если предиктор бинарный, то экспоненциальный к...   23.11.2008 - 00:56
- - nokh   Спасибо за разъяснения. Выходит что если предиктор...   27.11.2008 - 19:21
|- - плав   Цитата(nokh @ 27.11.2008 - 19:21) 1)...   27.11.2008 - 22:17
- - DrgLena   «Как вы это проделываете?» Да также ка...   28.11.2008 - 03:30
|- - плав   Цитата(DrgLena @ 28.11.2008 - 03:30)...   28.11.2008 - 10:29
- - DrgLena   Мы очевидно для разных целей используем кокс регре...   28.11.2008 - 14:27
|- - плав   Цитата(DrgLena @ 28.11.2008 - 14:27)...   28.11.2008 - 17:54
- - DrgLena   Да, мне наконец удалось, посчитать руками, помогла...   29.11.2008 - 04:11
|- - плав   Цитата(DrgLena @ 29.11.2008 - 04:11)...   1.12.2008 - 00:53
- - nokh   Спасибо за ответы и интересную дискуссию. Использо...   30.11.2008 - 23:23
|- - плав   Цитата(nokh @ 30.11.2008 - 23:23) Сп...   1.12.2008 - 00:56
- - DrgLena   "Все не так уж просто" Безусловно, не пр...   1.12.2008 - 02:09
|- - плав   Цитата(DrgLena @ 1.12.2008 - 02:09) ...   1.12.2008 - 21:57
- - Игорь   Цитата(DrgLena @ 1.12.2008 - 02:09) ...   1.12.2008 - 18:37
- - DrgLena   Я не стала бы возражать уважаемому модератору, но ...   2.12.2008 - 02:37
|- - плав   Цитата(DrgLena @ 2.12.2008 - 02:37) ...   2.12.2008 - 22:18
- - DrgLena   Ответ уже нашла http://www.weibull.com/   2.12.2008 - 21:37
- - DrgLena   Плав, спасибо большое за внимание и терпение, с к...   3.12.2008 - 16:05
|- - плав   Цитата(DrgLena @ 3.12.2008 - 16:05) ...   3.12.2008 - 22:21
- - DrgLena   Да, не используется не только кокс регрессионное м...   3.12.2008 - 23:58


Добавить ответ в эту темуОткрыть тему