Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

4 страниц V   1 2 3 > »   
Добавить ответ в эту темуОткрыть тему
> Анализ данных типа времени жизни, некоторые практические вопросы
Игорь
сообщение 12.12.2008 - 20:53
Сообщение #1





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



При анализе данных типа времени жизни возникает необходимость расчета дисперсии функции выживания. Она необходима для расчета ДИ.

На с. 238 книги "Эпидемиология" Власов приводит результаты, рассчитанные программой STATISTICA. Результаты вызывают сомнение (почему стандартная ошибка так растет к концу интервала - это не подтверждают расчеты). К тому же Власов дает ссылку на свою же формулу, представляющую собой просто дисперсию доли. Расчет именно по данной формуле практически не имеет ничего общего с приведенным листингом.

С другой стороны, Кокс в книге "Анализ данных типа времени жизни" на с. 53 дает формулу Гринвуда, расчет по которой просто не получается. По другой из формул (4.6, там же) результат выглядит правдоподобным, но отличается от результатов Власова.

Во-вторых, для ДИ Кокс приводит формулу, в которой фигурирует стандартное отклонение, а не стандартная ошибка. Если произвести вычисление по данной формуле, ДИ просто не получаются разумными.

Итак, вопрос. Как считать дисперсию и ДИ функции выживания?


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 12.12.2008 - 21:32
Сообщение #2





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Книги Кокса нет, но есть Hosmer, Jr. and Stanley Lemeshow. Applied Survival Analysis: Regression Modeling of Time to Event Data. Ее можно быстро найти в сети в формате djvu (3,8 Mб). Сейчас быстро пробежался - единственного решения нет - в книге этому отведено несколько страниц текста с описанием и формулами + приложения 1 и 3.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 12.12.2008 - 22:17
Сообщение #3





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Фрагмент начала таблицы:
Kaplan-Meier (Product-limit) analysis.Note: Censored cases are marked with +
Case Number Time Cumulatv Survival Standard Error
1 1+ 3.0667
2 2+ 3.0667
3 3+ 3.1000
4 4 3.2000 0.998906 0.001093
5 5+ 3.3333
6 6+ 3.5000
7 7 3.5667 0.997809 0.001547

Начиная с первого события (умер 4 больной), ошибка считается по той же формуле Гринвуда:
s.e.=0.998906*sqrt(1/(917*(917-1)))
дальше, для больного 7 (второй умерший), появляется еще одно слагаемое под корнем, и т.д. Ошибка растет не в конце интервала, а в конце наблюдения.
Все программы дают в этом модуле именно стандартную ошибку и она совпадает с посчитанной руками по формуле Гринвуда. Подробно и ясно написано у Стентона Гланца, стр 382-383. Таблица расползается, но ясно, что в последней колонке s.e.

Сообщение отредактировал DrgLena - 12.12.2008 - 22:18
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 12.12.2008 - 22:35
Сообщение #4





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(DrgLena @ 12.12.2008 - 22:17) *
Начиная с первого события (умер 4 больной), ошибка считается по той же формуле Гринвуда:
Формула Гринвуда (Гланц, стр.382) дает нулевую стандартную ошибку до момента смерти 1-ого пациента.


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 12.12.2008 - 22:54
Сообщение #5





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Дисперсия логарифма функции дожития:
\sum_{t_i<t}(d_i/(r_i-d_i)/r_i,
==Tex==$\sum_{t_i<t}\frac{d_i}{(r_i-d_i)r_i}$
где d_i - количество умерших в i-ом интервале, r_i - количество живых на начало i-го интервала
Соответственоо для S(t) дисперсия
S(t)^2*\sum_{t_i<t}(d_i/(r_i-d_i)/r_i,
==Tex==$S(t)^2*\sum_{t_i<t}\frac{d_i}{(r_i-d_i)*r_i}$
очевидно, что дисперсия будет "расползаться" к концу срока (в правой части графика выживаемости), поскольку количество живых на начало интервала будет снижаться.
Формула Пето
var(S(t))=S(t)^2*(1-S(t))/R(t)
==Tex== $var(S(t))= \frac{S(t)^2*(1-S(t))}{R(t)}$
где R(t) - численность группы риска
В формуле Пето дисперсия пересчитывается в момент цензурирования или смерти, в формуле Гринвуда - только смерти.
Расчет ДИ может белаться двумя путями:
S(t) +/- z(alpha/2)*\sqrt(Var(S(t))
Возможная проблема - выход ДИ за пределы 0 или 1
Рассчитать величину V(t)=ln(-ln(S(t))) - двойной логарифм функции выживания. Ее дисперсия Var(V(t))=Var(S(t))/[S(t)*ln(S(t))]^2
==Tex==$Var(V(t))=\frac{Var(S(t))}{[S(t)*ln(S(t))]^2}$
Доверительный интервал V(t)+/-z(alpha/2)*\sqrt(Var(V(t)).
==Tex==$V(t) \pm (alpha/2)*\sqrt{Var(V(t)}$
Доверительный интервал для функции выживания получается путем двойного экспоненциирования полученных границ.

Cantor A., SAS Survival Analysis Techniques for Medical Research., SAS Institute, 2003, p.23-25

P.S. поскольку формулы текстом набирать неудобно, после ==Tex== идут latex'овские формулы, можно посмотреть в любом редакторе, совместимом с ним.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 12.12.2008 - 23:23
Сообщение #6





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(DoctorStat @ 12.12.2008 - 22:35) *
Формула Гринвуда (Гланц, стр.382) дает нулевую стандартную ошибку до момента смерти 1-ого пациента.

Да, как и на первом интервале при расчете Таблиц выживаемости. При К-М первым интервалом считают тот, где произошло первое событие.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 13.12.2008 - 01:21
Сообщение #7





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DrgLena @ 12.12.2008 - 23:23) *
Да, как и на первом интервале при расчете Таблиц выживаемости. При К-М первым интервалом считают тот, где произошло первое событие.

По формуле Гринвуда дисперсию считают только на момент смерти пациента. По Пето - смерти или цензурирования
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 14.12.2008 - 17:41
Сообщение #8





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Заранее извиняюсь: немного ознакомился с литературой по этой новой для меня теме, поэтому могу фатально ошибаться, а могу и нет.
Цитата(DrgLena @ 12.12.2008 - 23:17) *
Все программы дают в этом модуле именно стандартную ошибку и она совпадает с посчитанной руками по формуле Гринвуда. Подробно и ясно написано у Стентона Гланца, стр 382-383. Таблица расползается, но ясно, что в последней колонке s.e.

Это - слишком сильное утверждение, означающее только одно - ВСЕ программы врут. Причем это не мое утверждение, а логический вывод из утверждения уважаемого собеседника. Ибо по формуле Гринвуда стандартную ошибку посчитать нельзя, т.к. по данной формуле считают не стандартную ошибку, а дисперсию. Чтобы из дисперсии получить стандартную ошибку, надо ее (дисперсию) поделить на численность чего-либо, а затем из промежуточного результата извлечь квадратный корень.

Вот в этом-то все и дело - на что именно делить дисперсию по Гринвуду? Если на суммы (оставшихся в живых + умерших в данный момент), результат расчета ДИ, по крайней мере, правдоподобен. А вот если не делить, то, опять повторюсь и извинюсь, все источники врут, т.к. почти для всей кривой выживаемости верхняя граница ДИ будет > 1. В том числе и Кокс, который, как и уважаемого собеседника, также лежит на моем столе. И я подставляю числа в формулу Гринвуда, и вижу, что результаты расчета различаются с приведенными. Причем сильно. При этом результаты расчета самой кривой выживаемости полностью (!) совпадают с имеющимися в распоряжении источниками (Власов, например).

Но все программы и источники врать не могут. Следовательно, приходим к выводу, что приводятся одни формулы, а результаты расчета, их иллюстрирующие, получены по другим формулам. Такое баловство мне давненько, лет 30, не встречалось.

Цитата(nokh @ 12.12.2008 - 22:32) *
Книги Кокса нет, но есть Hosmer, Jr. and Stanley Lemeshow. Applied Survival Analysis: Regression Modeling of Time to Event Data. Ее можно быстро найти в сети в формате djvu (3,8 Mб). Сейчас быстро пробежался - единственного решения нет - в книге этому отведено несколько страниц текста с описанием и формулами + приложения 1 и 3.

Посмотрел. Хорошая идея - функция = 1 до гибели 1-го пациента. В STATISTICA этого нет. А вот то, что авторы сознательно избегают решения "жареных" вопросов (например, что делать, если есть несколько пациентов с одним сроком, причем часть из них цензурирована, а часть нет), чести им не делает. А вот Власов данный вопрос рассмотрел подробно.

Цитата(плав @ 12.12.2008 - 23:54) *
Cantor A., SAS Survival Analysis Techniques for Medical Research., SAS Institute, 2003, p.23-25

Спасибо, не видел данную книгу. Начал искать - не нашел. Поискал еще. Может, кому пригодится. 1 глава - http://support.sas.com/publishing/pubcat/chaps/58416.pdf. Вторая глава - http://books.google.ru/books?id=iyvvwCAM_aUC&output=html. Очень приятно.

Сообщение отредактировал Игорь - 14.12.2008 - 18:52


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 14.12.2008 - 18:52
Сообщение #9





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Игорь, я уважаю вас за смелость высказывания, однако вы не потрудились заглянуть на указанную стр у Гланца. Там приведена формула Гринвуда для расчета стандартной ошибки выживаемости. Я вам показала, что я ручками получаю то, что дают программы и называют они это s.e. и это вовсе не дисперсия, а дальше там написано, как ДИ считается, используя s.e. Вы пользуетесь той же формулой?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 14.12.2008 - 20:30
Сообщение #10





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DrgLena @ 14.12.2008 - 18:52) *
Игорь, я уважаю вас за смелость высказывания, однако вы не потрудились заглянуть на указанную стр у Гланца. Там приведена формула Гринвуда для расчета стандартной ошибки выживаемости. Я вам показала, что я ручками получаю то, что дают программы и называют они это s.e. и это вовсе не дисперсия, а дальше там написано, как ДИ считается, используя s.e. Вы пользуетесь той же формулой?

Это где-то уже обсуждалось ранее, но я все-таки повторю. Принципиальная ошибка здесь в том, что забывается, что se - это не что иное, как стандартное отклонение выборочных средних. Соответственно, квадрат se - это дисперсия выборочных средних. Для расчета ДИ нужна дисперсия (или стандартное отклонение). Просто дисперсия выборочных средних по центральной предельной теореме определяется как популяционная дисперсия деленная на квадратный корень из размера выборки. Отсюда и путаница.
Поэтому в данном случае определяем дисперсию функции выживаемости, извлекаем из нее корень и используем для оценки ДИ. Еще раз, чтобы не было так путанно, ДИ зависит от дисперсии изучаемого параметра, а SE - показатель, который только путает ситуацию (грубо говоря, забудьте о SE и говорите о стандартном отклонении/дисперсии)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 14.12.2008 - 21:01
Сообщение #11





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Да, Игорь запутался именно из-за перевода и терминологии. Хотелось бы, чтобы у нас был тот же язык, который во всем мире принят для s.e. SD и Variance
Формула Гринвуда, вывод которой Кокс приводит, это формула для дисперсии. На странице 54, если книжка Кокса перед вами вы можете увидеть, что для первого значения функции выживания 0,8571 стандартное уклонение, на самом деле это стандартная ошибка (s.e.), и она получена так=0.8571*sqrt(3/(21*(21-3))) =0.0763565368 ее и используют для расчета ДИ
Корень квадратный из формулы Гринвуда и есть s.e. и Гланц ее и приводит.
Once the variance has been calculated, the standard error can be determined by taking the square root of the variance: http://www.weibull.com/LifeDataWeb/nonpara...ic_analysis.htm
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 14.12.2008 - 22:20
Сообщение #12





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Да, спасибо, по Гланцу все считается нормально.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 29.12.2008 - 19:37
Сообщение #13





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Если позволите, 2-й практический вопрос.

Зачем программа STATISTICA (судя по имеющимся иллюстрациям из источников) выводит на графике выживаемости обозначения (крестиком) цензурированных индивидуумов?

Полагаю, что вывод на графике данной информации не имеет никакого смысла, т.к., во-первых, цензурирование уже учтено при построении графика. Во-вторых, график выживаемости является своего рода интегральной характеристикой, построенной по данным достаточно большой совокупности пациентов, и от каждого конкретного пациента график абстрагирован. Ну, и в-третьих, может быть несколько (много) больных с одним и тем же сроком, причем часть из них может быть цензурирована, а часть нет.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 29.12.2008 - 20:35
Сообщение #14





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Мне как раз нравится видеть на этих графиках плюсики, но к сожалению там есть и нулики. Анализируя такой график, можно увидеть, где сосредоточены и те и другие. Метастазирование при этой патологии чаще отмечается в первые 5 лет, но не для всех типов опухолей. Полезна также информация, что есть отдаленные наблюдения и там много выживших, т.е. цензурированных на определенный срок. По такому графику можно сказать например, что более 20 лет наблюдается 101 больной, и это не просто цензурированные на этот срок наблюдения, а конкретные больные, которые отвечают на письма, после онкопатологии.
Прикрепленные файлы
Прикрепленный файл  onco3.ppt ( 499,5 килобайт ) Кол-во скачиваний: 592
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 29.12.2008 - 20:38
Сообщение #15





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Игорь @ 29.12.2008 - 19:37) *
Если позволите, 2-й практический вопрос.

Зачем программа STATISTICA (судя по имеющимся иллюстрациям из источников) выводит на графике выживаемости обозначения (крестиком) цензурированных индивидуумов?

Полагаю, что вывод на графике данной информации не имеет никакого смысла, т.к., во-первых, цензурирование уже учтено при построении графика. Во-вторых, график выживаемости является своего рода интегральной характеристикой, построенной по данным достаточно большой совокупности пациентов, и от каждого конкретного пациента график абстрагирован. Ну, и в-третьих, может быть несколько (много) больных с одним и тем же сроком, причем часть из них может быть цензурирована, а часть нет.

Цензурированные наблюдения на графике приводить принято по причине того, что в этом случае (при Каплан-Мейере) на графике есть все данные. Поскольку принято считать время наблюдения в днях, вероятность того, что в конкретный день будет много умерших и цензурированных невелика, особенно учитывая то, что анализ пришел из онкологии с относительно небольшими группами. Кроме того, большое количество цензурированных наблюдений в начале будут указывать на подозрительность оценок функции выживаемости на более поздних сроках.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

4 страниц V   1 2 3 > » 
Добавить ответ в эту темуОткрыть тему