Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> регрессия Кокса
mamalita
сообщение 29.03.2012 - 16:00
Сообщение #1





Группа: Пользователи
Сообщений: 49
Регистрация: 7.04.2010
Пользователь №: 15366



Добрый день! Помогите разобраться. Имеются данные для анализа выживаемости:
время (месяцы),
событие (рецидив или нет),
независимые ковариаты 3 переменных -
1. дифференцировка - бинарная (низкодифференированныя и умеренно+высокодифференцированная)
2. уровень РЭА до операции
3. количество метастазов
Они остались в результате применения регрессионного анализа Кокса в СПСС. Т.е. я понимаю что можно сделать выводы, что такие то факторы значимо влияют на продолжительность безрецидивной жизни, какой из них более значим. Могу ли я применить это как-то в плане прогнозирования продолжительности безрецидивной жизни? (как например в логистической регрессии). Это пожалуй основной вопрос. Цель исследования не только выявить исходные факторы, влияющие на продолжительность безрецидивного течения, но и иметь возможность прогнозировать это время для любого конкретного больного.
Привожу формулу h(t)=h0(t) *exp(b1z1+...+bmzm)
В СПСС есть функция сохранить: функция риска - это h(t)? Для 2 больных проживших 1 мес у одного 2,1 а другого 0,6. О чем это говорит? Максимум 4,3 минимум 0,2 - это много или мало. Как мне найти h0(t) - базовая функция риска при нулевых ковариатах (нулевые это равные 0?) и нужно ли это?
С экспоненциальной регрессией более понятно, но у меня время жизни распределено не экспоненциально. В Attestat сделала подгонку распределения: получилось логлогистическое. Что мне с ним делать?!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
mamalita
сообщение 13.04.2012 - 18:29
Сообщение #2





Группа: Пользователи
Сообщений: 49
Регистрация: 7.04.2010
Пользователь №: 15366



[С переменными: количество метастазов не совсем ясно, т.е. они были до операции или выявлены после?]
Метастазы были выявлены до операции. Прогрессия конечно же после операции. 1 - прогрессия есть 0 - прогрессии нет. Сроки разные потому что были выбывшие по неизвестным причинам пациенты (цензуированные данные). Все размеры суммарные и количество взяты до операции. То что суммарное количество не совпадает для меня новость, может быть при копировании что-то не так было. Давайте от V10 пока абстрагируемся (я пересмотрю данные поищу ошибку).
И наконец задачи следующие 1. выявить факторы наиболее значимо влияющие на безсобытийную выживаемость (событие - прогрессия), время развития прогрессии - с этим я вроде бы справилась.
2. по полученной зависимости иметь возможность прогнозировать среднее предполагаемое время жизни без прогрессии для каждого конкретного пациента (хотелось бы как в логистической регрессии получить некое уравнение, при подстановке в которое значений предикторов получать это самое время). В идеале хотелось бы оценить потом эту модель на другой выборке с вытекающими отсюда последствиями. Например, столько -то правильных предсказаний, столько неправильных, специфичность, чувствительность. Но тут я не знаю возможно ли подобное. Например у нас пациент прожил без прогрессии 3 месяца а модель предсказывает 7 месяцев - это правильное предсказание или нет, а у другого который прожил 3 месяца - предсказывает 18 месяцев - ну это понятно будет неправильно. Может быть должны быть какие-то доверительные интервалы по которым ориентироваться на правильность предсказаний.
Еще момент как проверить: вообще применима ли к моим данным регрессия Кокса? (должно соблюдаться условие пропорциональности риска - как проверить)
Спасибо!!!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
YVR
сообщение 13.04.2012 - 19:47
Сообщение #3





Группа: Пользователи
Сообщений: 63
Регистрация: 20.03.2012
Из: Ташкент
Пользователь №: 23582



Цитата(mamalita @ 13.04.2012 - 20:29) *
[С переменными: количество метастазов не совсем ясно, т.е. они были до операции или выявлены после?]
Метастазы были выявлены до операции. Прогрессия конечно же после операции. 1 - прогрессия есть 0 - прогрессии нет. Сроки разные потому что были выбывшие по неизвестным причинам пациенты (цензуированные данные). Все размеры суммарные и количество взяты до операции.


Ясно, значит все, кроме прогрессии и сроков до выявления прогрессии относится к данным до операции.

Цитата(mamalita @ 13.04.2012 - 20:29) *
То что суммарное количество не совпадает для меня новость, может быть при копировании что-то не так было. Давайте от V10 пока абстрагируемся (я пересмотрю данные поищу ошибку).

Где-то действительно закрались ошибки, т.к. если например, взять ячейку J5, то в ней указано количество 5, а в ячейках E5 = 5, F5 = 1 и G5 = 1, что в сумме должно дать 7, а никак не 5.


Цитата(mamalita @ 13.04.2012 - 20:29) *
И наконец задачи следующие 1. выявить факторы наиболее значимо влияющие на безсобытийную выживаемость (событие - прогрессия),


Можно.

Цитата(mamalita @ 13.04.2012 - 20:29) *
время развития прогрессии - с этим я вроде бы справилась.


Тоже разрешимо


Цитата(mamalita @ 13.04.2012 - 20:29) *
2. по полученной зависимости иметь возможность прогнозировать среднее предполагаемое время жизни без прогрессии для каждого конкретного пациента (хотелось бы как в логистической регрессии получить некое уравнение, при подстановке в которое значений предикторов получать это самое время).

Только в данной задаче адекватно время не получать, а задавать в качестве таймерного события.


Цитата(mamalita @ 13.04.2012 - 20:29) *
В идеале хотелось бы оценить потом эту модель на другой выборке с вытекающими отсюда последствиями. Например, столько -то правильных предсказаний, столько неправильных, специфичность, чувствительность. Но тут я не знаю возможно ли подобное.

Это уже не идеал, а тест на эргодичность. Если математическая модель строится для неэргодичной среды, то вне выборки она может дать статистически незначимые результаты, т.е. эксперимент будет нерепродуицируем.

Цитата(mamalita @ 13.04.2012 - 20:29) *
Например у нас пациент прожил без прогрессии 3 месяца а модель предсказывает 7 месяцев - это правильное предсказание или нет, а у другого который прожил 3 месяца - предсказывает 18 месяцев - ну это понятно будет неправильно.

Неправильно предсказывать точное время вероятностных событий если они недостоверны. Например, из немного другой области, скажем в спорте, можно с помощью распределения Пуассона при известной среднестатистической забиваемости командой количества мячей в чужие ворота за 90 минут матча, рассчитать вероятность того что эта же команда в следующем матче не забьет ни одного гола либо вероятность того, что она забьет 10 мячей. Причем распределение Пуассона статистически значимо и в хоккее и в футболе. Точно также и в данном случае, можно только по факторам вычислить вероятность того, что пациент проживет без рецидива некий наперед заданный срок, например, месяц, два месяца, квартал, полугодие или год. Такова особенность теории вероятностей и статистики - оперировать вероятностными величинами для событий, а не конкретными сроками от одного события до другого. Сколько пройдет времени у конкретного пациента до рецидива точно вычислить невозможно.

Чтобы было проще понять, почему так происходит, подбросьте 10 раз монету. Она может выпасть орлом и 10 раз подряд и решкой 10 раз подряд. Вероятности для вышеуказанных обоих событий при условии правильной монеты равны 1 / 1024. Т.е. предсказать сколько раз подряд монета может выпасть орлом в следующей серии подбрасываний невозможно, но угадать либо не угадать с той или иной вероятностью можно.


Цитата(mamalita @ 13.04.2012 - 20:29) *
Может быть должны быть какие-то доверительные интервалы по которым ориентироваться на правильность предсказаний.
Еще момент как проверить: вообще применима ли к моим данным регрессия Кокса? (должно соблюдаться условие пропорциональности риска - как проверить)
Спасибо!!!

Любую модель можно перепроверить на эргодичность только на независимой выборке и только после такой проверки уже решать вопросы применимости или неприменимости. Тем паче что один и тот же метод математического моделирования может иметь несколько допустимых решений (например, в задаче оптимизации на отдельно взятой выборке может быть несколько экстремумов и лишь один или более из них эргодичны независимо от выборки, а можеть быть, что и ни одного эргодичного не будет выявлено).

В общем и в целом все понятно, за исключением некоторых ошибок и неточностей в исходных данных. А ошибки в исходных - не есть хорошо, т.к. запросто можно обнаружить черную кошку в темной комнате, несмотря на то, что ее там никогда не было.

Сообщение отредактировал YVR - 13.04.2012 - 21:55


Signature
Yury V. Reshetov

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- mamalita   регрессия Кокса   29.03.2012 - 16:00
- - p2004r   [вдруг пригодится] вот целая ветка как в R проводи...   29.03.2012 - 17:05
- - mamalita   Добрый день! Спасибо большое за указанное напр...   2.04.2012 - 10:30
- - mamalita   Извиняюсь, данные загрузились, дальше двигалась по...   2.04.2012 - 11:15
|- - TheThing   Цитата(mamalita @ 2.04.2012 - 11:15)...   2.04.2012 - 12:51
- - mamalita   Спасибо! Дело пошло дальше. Тупо повторяю кома...   2.04.2012 - 16:02
|- - p2004r   Цитата(mamalita @ 2.04.2012 - 16:02)...   2.04.2012 - 20:31
- - p2004r   У Кокса plot(survfit(model)) - shows the survivor...   2.04.2012 - 21:32
- - mamalita   У меня новая проблема технического характера: все ...   3.04.2012 - 10:50
|- - p2004r   Цитата(mamalita @ 3.04.2012 - 10:50)...   3.04.2012 - 13:05
- - mamalita   Надо просто найти где вычислялся v9 и вычислить. О...   4.04.2012 - 08:50
|- - TheThing   Цитата(mamalita @ 4.04.2012 - 08:50)...   4.04.2012 - 09:31
|- - p2004r   Цитата(mamalita @ 4.04.2012 - 08:50)...   4.04.2012 - 10:42
- - mamalita   С английским дружо плохо, но посмотрю, просто руки...   12.04.2012 - 14:06
|- - YVR   Цитата(mamalita @ 12.04.2012 - 16:06...   12.04.2012 - 14:20
|- - p2004r   Цитата(mamalita @ 12.04.2012 - 14:06...   14.04.2012 - 23:09
- - mamalita   Добрый день! Остроумненько. Прилагаю данные. Д...   13.04.2012 - 14:26
- - YVR   Цитата(mamalita @ 13.04.2012 - 16:26...   13.04.2012 - 17:44
- - mamalita   [С переменными: количество метастазов не совсем яс...   13.04.2012 - 18:29
|- - YVR   Цитата(mamalita @ 13.04.2012 - 20:29...   13.04.2012 - 19:47
|- - p2004r   Цитата(mamalita @ 13.04.2012 - 18:29...   14.04.2012 - 23:21
- - YVR   Попробовал анализировать исходные данные. Выводы: ...   14.04.2012 - 19:37
|- - p2004r   Цитата(YVR @ 14.04.2012 - 19:37) Поп...   14.04.2012 - 23:25
- - p2004r   Скопируйте сюда R текст своего анализа. Будет прод...   14.04.2012 - 23:23
- - mamalita   RE: регрессия Кокса   17.04.2012 - 07:15
- - mamalita   Уважаемый YVR! Рецидивы через три года были де...   17.04.2012 - 07:36
- - mamalita   Уважаемый р2004r! у меня проблемы с сохранение...   17.04.2012 - 07:48
|- - p2004r   Цитата(mamalita @ 17.04.2012 - 07:48...   17.04.2012 - 11:29
- - mamalita   А где посмотреть сами формулы? Могу ли я это сдела...   19.04.2012 - 10:42
|- - p2004r   Цитата(mamalita @ 19.04.2012 - 10:42...   27.04.2012 - 20:00
- - YVR   Цитата(mamalita @ 17.04.2012 - 09:36...   19.04.2012 - 12:47
- - mamalita   А что это за формула и вообще какой метод? И почем...   23.04.2012 - 13:19
|- - YVR   Цитата(mamalita @ 23.04.2012 - 15:19...   23.04.2012 - 16:54
- - mamalita   И все таки как же мне найти h0?   23.04.2012 - 13:20
- - mamalita   И все-таки какой метод и что за формула? Вопрос пр...   24.04.2012 - 13:21
|- - YVR   Цитата(mamalita @ 24.04.2012 - 15:21...   24.04.2012 - 14:24
|- - p2004r   Цитата(YVR @ 24.04.2012 - 14:24) Мат...   27.04.2012 - 20:15
- - YVR   Цитата(p2004r @ 27.04.2012 - 22:15) ...   19.05.2012 - 20:48
- - DrgLena   Цитата(YVR @ 19.05.2012 - 20:48) О ч...   20.05.2012 - 12:14
- - YVR   Цитата(DrgLena @ 20.05.2012 - 14:14)...   20.05.2012 - 13:03
- - DrgLena   Да вы хоть поняли, что у всех больных уже были опе...   20.05.2012 - 13:36
- - YVR   Цитата(DrgLena @ 20.05.2012 - 15:36)...   20.05.2012 - 13:48
- - DrgLena   Цитата(YVR @ 20.05.2012 - 13:48) Вам...   20.05.2012 - 17:43
- - YVR   Цитата(DrgLena @ 20.05.2012 - 19:43)...   20.05.2012 - 18:05
|- - p2004r   Цитата(YVR @ 20.05.2012 - 18:05) Эпи...   20.05.2012 - 18:21
- - YVR   Цитата(p2004r @ 20.05.2012 - 20:21) ...   20.05.2012 - 20:16
- - p2004r   Цитата(YVR @ 20.05.2012 - 20:16) Ну ...   20.05.2012 - 21:42


Добавить ответ в эту темуОткрыть тему