Здравствуйте, гость ( Вход | Регистрация )
10.03.2008 - 07:36
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Идеальные данные для анализа выживаемости - когда точно известно сколько человек прожил, например, после операции и когда умер. В этом случае цензурированных наблюдений нет. Другой крайний случай - когда все наблюдения цензурированные и дальнейшая судьба пациентов неизвестна. Например один прожил больше года, другой - больше трех. В этом случае может оказаться, что больше года - это 5, а больше трех - это 4. Поэтому, насколько я понимаю, сравнить выживаемость в двух группах где все наблюдения цензурированные невозможно в принципе. А какова допустимая доля цензурированных наблюдений в выборке? Существуют ли какие-то обоснованные или негласные правила? Полазил в и-нете, заглянул в книжки - пока ответа не нашел, хотя везде рассматриваются примеры где полные данные заметно преобладают над цензурированными. Или может считать цензурированными только точно живых на момент анализа, а всех потерявшихся считать умершими в интервале между двумя осмотрами, как прочитал в одной статье?
|
|
|
![]() |
![]() |
![]() |
2.12.2008 - 02:37
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Я не стала бы возражать уважаемому модератору, но у меня на столе лежит первоисточник, причем на русском языке, крупного английского математика Д.Р. Кокса, который в соавторстве с Д. Оуксом в 1983 году написал эту книгу «Анализ данных типа времен жизни», у нас она вышла в 1988, и к этому времени на русском языке это уже была седьмая его книга. Цель, которой автор посвятил эту работу звучит так, ? изучить влияние различных факторов, которые в этой книге названы поясняющими переменными или ковариатами на продолжительность жизни. В 1972 году Кокс предложил математическую модель, «в рамках которой можно исследовать влияние ковариат на продолжительность жизни». Так написал сам автор метода. Почему же не исследовать. Большинство примеров и упражнения в этой книге - по расчету времени жизни. Так что цели определены.
Мне не ясно другое, какие параметры распределения я должна привести, чтобы показать, что я имею дело именно с распределением Вейбулла, чтобы не было вопросов. Значения лямбда и гамма или значение Shape ? форма и Scale - параметр масштаба? Визуально на приводимых графиках мои данные (та же выборка) согласуются с обоими этими распределениями. Хотя и с экспоненциальным тоже согласуется, но хуже. Возможно из-за большого числа наблюдений. Поясните мне, пожалуйста, что такое задача AFTM? И что значит метод Вейбулла. |
|
|
![]() |
![]() |
2.12.2008 - 22:18
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Я не стала бы возражать уважаемому модератору, но у меня на столе лежит первоисточник, причем на русском языке, крупного английского математика Д.Р. Кокса, который в соавторстве с Д. Оуксом в 1983 году написал эту книгу «Анализ данных типа времен жизни», у нас она вышла в 1988, и к этому времени на русском языке это уже была седьмая его книга. Цель, которой автор посвятил эту работу звучит так, ? изучить влияние различных факторов, которые в этой книге названы поясняющими переменными или ковариатами на продолжительность жизни. В 1972 году Кокс предложил математическую модель, «в рамках которой можно исследовать влияние ковариат на продолжительность жизни». Так написал сам автор метода. Почему же не исследовать. Большинство примеров и упражнения в этой книге - по расчету времени жизни. Так что цели определены. Мне не ясно другое, какие параметры распределения я должна привести, чтобы показать, что я имею дело именно с распределением Вейбулла, чтобы не было вопросов. Значения лямбда и гамма или значение Shape ? форма и Scale - параметр масштаба? Визуально на приводимых графиках мои данные (та же выборка) согласуются с обоими этими распределениями. Хотя и с экспоненциальным тоже согласуется, но хуже. Возможно из-за большого числа наблюдений. Поясните мне, пожалуйста, что такое задача AFTM? И что значит метод Вейбулла. Не хочется вступать в длительную дискуссию (например, какое слово переводчики переводили под слово "продолжительность жизни", если survival или hazard, то ситуация меняется кардинальным образом), напомню только вот что: в статье 1972 года Кокс предложил модель, которая была названа моделью пропорционального риска (генерализацию моделей распределения Вейбулла и Гомперца) и, одновременно, новый метод оценки модели под названием частичного правдоподобия (partial likelihood). В модели пропорционального риска риск (hazard) каждого человека определяется как часть общей опасности: h_i(t)/h_j(t)=exp(b1*x_i-x_j)+...). Как видно в этом уравнении базовый риск отсутствует. Он исчез при использовании модели пропорциональности риска (т.е. мы сравниваем не выживаемость, а отношения выживаемостей). Гениальность Кокса заключалась как раз в том, что он предложил метод (частичного правдоподобия), который позволял оценить регрессионные коэффициенты (b) не специфицируя фрму распределения функции опасности. Платой за использование этого метода стала некоторая потеря эффективности (при анализе коэффициентов - их стандартные ошибки чуть больше) и невозможность получить информацию о форме и характеристиках фнукции выживаемости из данных модели. Точно так же, как на основании отношения шансов невозможно восстановить ) без дополнительной информации) исходные частоты, так и на основании результатов модели Кокса невозможно оценить исходную функцию выживаемости S(t) (это, напомню, антилогарифм интеграла функции опасности от 0 до t). Настоятельно рекомендую просто разобраться в математике модели, тогда то, что я описываю станет понятным (кстати, просто попробуйте восстановить функцию h(t) на основании того, что представлено в распечатке модели и поймете, что там информации для этого нет). То, что написал Кокс абсолютно правильно, оценить влияние ковариант на функцию выживаемости (точнее опасность) можно, но восстановить саму функцию выживаемости - нет (а это в цитате и не утверждается). И я утверждал именно то же самое - модель Кокса предназначена для оценки факторов риска (т.е. сравнения функций выживаемости друг с другом, а не оценки ее значений). Соответственно, оценивать эту функцию надо как-то по другому - и делается при помощи эмпирической функции выживаемости (точнее, опасности), которая строится по методу Каплана-Мейера. Здесь в теории все заканчивается хорошо, поскольку в теории у нас достаточно значений, чтобы точно определить форму эмпирической кривой. На практике это не так. Точность оценки эмпирической кривой в период времени t, очевидно, зависит от количества доживших до времени t (как и любой другой выборочный метод). Соответственно, если группа риска мала, то и оценка функции выживаемости будет подвержена достаточно большим выборочным колебаниям. Вообще почти все статистические пакеты имеют в своем составе набор программ для оценки и простейшего сравнения фнукицй (кривых) выживаемости. Чаще всего функции оцениваются по методу Каплана-Мейера или методу таблиц дожития и сравниваются статистикой Вилкоксона или Пето (лог-ранг). В моделях AFTM (accelerated failure time models) моделируется изменение функции опасности (выживаемости) под влиянием переменных Формально выбор распределения делается на основе изучения эмпирической функции правдоподобия - если логарифм опасности (hazard) является константой, то соответствующее распределение - экспоненциальное, если линейно зависит от времени (a*t), то Гомперца, если имеет форму a*log(t), где t-время, то распределение Вейбулла. Надо помнить, что если истинное распределение - экспоненциальное, то оценка по моделям Вейбулла или Гомперца будет давать одинаковые кривые. Соответственно, задача аналитика выбрать адекватную функцию распределения и затем строить модель с использованием этой функции (приводятся графиики или используется стандратный тест соответствия теоретического и эмпирического распределений). Уравнение AFTM чаще всего имеет следующий вид log(T_i)=a+b1*x1+b2*x2 +... \epsilon_i, где распределение \epsilon дает название модели (экспоненциальная, Вейбулла, Гомперца). Модели Вейбулла и экспоненциальная формально (экспоненциальная модель - это модель Вейбулла с параметром Scale=1) являются моделями пропорционального риска - после трансформации коэффициенты могут использоваться как отношения опасностей. |
|
|
![]() |
![]() |
nokh Допустимая доля цензурированных наблюдений в анализе выживаемости 10.03.2008 - 07:36
DrgLena Естественно, что анализ выживаемости не проводят,... 12.03.2008 - 23:55
nokh Спасибо за внимание к моей проблеме. С анализом вы... 13.03.2008 - 00:51
плав Цитата(nokh @ 13.03.2008 - 00:51) Сп... 13.03.2008 - 12:58

ВалНест Речь идет о цензурированных сулчаях, т.е. известно... 1.06.2008 - 09:16
ВалНест Цитата(nokh @ 13.03.2008 - 01:51) Сп... 1.06.2008 - 09:10
плав Цитата(ВалНест @ 1.06.2008 - 10:10) ... 3.06.2008 - 22:57
DrgLena Вы затронули очень важную тему в анализе данных. Ч... 13.03.2008 - 12:53
DrgLena Обведенная колонка у меня съехала, я хотела отмети... 13.03.2008 - 12:57
плав To DrgLena
Если известно, что человек был жив чере... 13.03.2008 - 13:24
ВалНест Уважаемый ПЛАВ!
У меня проблемы при сравнении ... 1.06.2008 - 08:48
DrgLena Как именно игнориорвать мне и не ясно. Условие вкл... 13.03.2008 - 14:12
DrgLena Вот пример реальный, из той же базы данных, сравни... 13.03.2008 - 14:37
плав Цитата(DrgLena @ 13.03.2008 - 14:37)... 13.03.2008 - 18:38
DrgLena График убежал, повторяю jpg 13.03.2008 - 14:40
nokh Спасибо! На свои вопросы я ответы получил. Вых... 13.03.2008 - 22:55
Igoroshka Позвольте и свои 5 копеек добавить .
Усеченные (ц... 4.08.2008 - 17:58
плав Ну и каким образом это "улучшает" выжива... 5.08.2008 - 13:24
Igoroshka Цитата(плав @ 5.08.2008 - 13:24) Ну ... 5.08.2008 - 14:11
плав Цитата(Igoroshka @ 5.08.2008 - 15:11... 9.08.2008 - 20:14
Igoroshka Цитата(плав @ 9.08.2008 - 20:14) Глу... 12.08.2008 - 12:20
плав Цитата(Igoroshka @ 12.08.2008 - 13:2... 20.08.2008 - 11:10
Игорь Цитата(плав @ 9.08.2008 - 20:14) Глу... 10.08.2008 - 18:58
Игорь По информационным каналам прошло сообщение. Как ра... 1.10.2008 - 15:26
Igoroshka Цитата(Игорь @ 1.10.2008 - 15:26) По... 4.10.2008 - 09:42
nokh Еще информация к размышлению по части анализа выжи... 9.10.2008 - 21:44
Игорь Цитата(nokh @ 9.10.2008 - 22:44) Еще... 10.10.2008 - 13:19
nokh Не стал открывать новую ветку, т.к. вопрос опять п... 14.11.2008 - 08:59
плав Цитата(nokh @ 14.11.2008 - 08:59) Не... 14.11.2008 - 16:43
nokh Большое спасибо, пока все получилось красиво. Но я... 17.11.2008 - 18:28
плав Цитата(nokh @ 17.11.2008 - 18:28) Бо... 21.11.2008 - 23:13
nokh Спасибо. Получается, что если переменная бинарная,... 22.11.2008 - 18:05
DrgLena Да, если предиктор бинарный, то экспоненциальный к... 23.11.2008 - 00:56
nokh Спасибо за разъяснения. Выходит что если предиктор... 27.11.2008 - 19:21
плав Цитата(nokh @ 27.11.2008 - 19:21) 1)... 27.11.2008 - 22:17
DrgLena «Как вы это проделываете?»
Да также ка... 28.11.2008 - 03:30
плав Цитата(DrgLena @ 28.11.2008 - 03:30)... 28.11.2008 - 10:29
DrgLena Мы очевидно для разных целей используем кокс регре... 28.11.2008 - 14:27
плав Цитата(DrgLena @ 28.11.2008 - 14:27)... 28.11.2008 - 17:54
DrgLena Да, мне наконец удалось, посчитать руками, помогла... 29.11.2008 - 04:11
плав Цитата(DrgLena @ 29.11.2008 - 04:11)... 1.12.2008 - 00:53
nokh Спасибо за ответы и интересную дискуссию. Использо... 30.11.2008 - 23:23
плав Цитата(nokh @ 30.11.2008 - 23:23) Сп... 1.12.2008 - 00:56
DrgLena "Все не так уж просто"
Безусловно, не пр... 1.12.2008 - 02:09
плав Цитата(DrgLena @ 1.12.2008 - 02:09) ... 1.12.2008 - 21:57
Игорь Цитата(DrgLena @ 1.12.2008 - 02:09) ... 1.12.2008 - 18:37
DrgLena Ответ уже нашла
http://www.weibull.com/ 2.12.2008 - 21:37
DrgLena Плав, спасибо большое за внимание и терпение, с к... 3.12.2008 - 16:05
плав Цитата(DrgLena @ 3.12.2008 - 16:05) ... 3.12.2008 - 22:21
DrgLena Да, не используется не только кокс регрессионное м... 3.12.2008 - 23:58![]() ![]() |