Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Регрессия Кокса с зависящими от времени ковариатами
Daria
сообщение 26.07.2018 - 21:24
Сообщение #1


Дух форума
*

Группа: Пользователи
Сообщений: 19
Регистрация: 25.02.2018
Пользователь №: 31032



Здравствуйте!
При выполнении анализа один из предикторов (категориальный, три уровня) связан со временем, что нарушает предположении о пропорциональности. Это я вполне ожидала. Диагностику проводила при помощи процедуры оценки остатков Шонфельда в Стата (phtest). Затем я в модели задала взаимодействие этого предиктора со временем (чисто эпмирически "ln(_t)"). В результате этот предиктор также статистически значимо влиял на исход. Однако, Стата не дает провести анализ остатков Шонфельда с таким взаимодействием (tvc): "this post-estimation command is not allowed after estimation with tvc();
see tvc note for an alternative to the tvc() option". В справке описан способ, как создать новую переменную, которая будет представлять собой такой взаимодействие. Однако остались вопросы.

Вопросы:
1. Как установить, как именно предиктор связан со временем (логарифмически, степенной функцией?)? Создать несколько моделей, потом сравнить их между собой?
2. Могу ли я потом, используя такую модель, построить кривую выживаемости при определенных значениях ковариат?

Очень рассчитываю на вашу помощь.

Сообщение отредактировал Daria - 28.07.2018 - 14:41
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Daria
сообщение 1.08.2018 - 07:57
Сообщение #2


Дух форума
*

Группа: Пользователи
Сообщений: 19
Регистрация: 25.02.2018
Пользователь №: 31032



Почти 150 просмотров и нет ответов... Никто действительно не знает или причина в чем-то другом?

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 2.08.2018 - 00:52
Сообщение #3


Дух форума
*

Группа: Пользователи
Сообщений: 1071
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Daria @ 1.08.2018 - 09:57) *
Почти 150 просмотров и нет ответов... Никто действительно не знает или причина в чем-то другом?

Вопрос нормальный, скорее всего "никто действительно не знает" наверняка + не работают в Statа. Я, например, сомневаюсь, что можно использовать "чисто эпмирически "ln(_t)"". Я бы использовал так называемую нормировку на среднее значение логарифма времени. Т.е. член модели не Р*ln(_t), а Р*ln(_t)-среднее(ln_t). По крайней мере когда я знакомился с регрессией Кокса, то подсмотрел это здесь: http://statistica.ru/local-portals/medicin...ni-kovariatami/ . Сейчас деталей не помню, но помню, что с такой нормировкой оценка предиктора P получалась близкой к его оценке в модели пропорциональных интенсивностей. Смотрел в Statistica и SPSS, в R - только без зависящих от времени ковариат.

Вопрос 1. Ответа не знаю. Обычная "стандартная" модель, вероятно, подразумевает степенное взаимодействие. Возможно, форму зависимости можно более точно установить по остаткам модели.
Вопрос 2. "Построить кривую выживаемости при определенных значениях ковариат" должны смочь. Statistica это позволяет, значит и Stata сможет. Сложнее - с формализацией полученной модели. Т.е. пока данные находятся в памяти пакета, то на основании базовых выживаемостей/рисков эти расчёты сделать можно. Но чтобы создать рабочую формулу для последующих расчётов, скажем, в Excel, насколько понимаю, эти базовые функции нужно будет отдельно приближать какой-либо функцией из числа обычно используемых в анализе выживаемости (типа Гомперца).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Daria
сообщение 2.08.2018 - 08:56
Сообщение #4


Дух форума
*

Группа: Пользователи
Сообщений: 19
Регистрация: 25.02.2018
Пользователь №: 31032



Доброе утро!
Спасибо большое за подробный ответ!

Сделала как Вы сказали - зависимость от времени пропала! Просто я в процессе экспериментов пробовала разные взаимодействия: р*(1/exp(_t)) или даже d*(1/ln(-0.1226*_t^2 + 0.6323*_t + 0.6958)). Указала только те, которые "сработали". Первое нашла также эмпирически, а второе - прикинула отношение рисков для разных значений признака на трех временных точках, построила график в экселе, получила тренд в виде квадратичной функции (r^2=1) и взяла обратную ей (уж не знаю, насколько я была права, сделала это уже от отчаяния). Все три подхода дали ожидаемый результат, а как выбрать из них оптимальный? По какому признаку?

Сообщение отредактировал Daria - 2.08.2018 - 22:51
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Daria
сообщение 2.08.2018 - 22:35
Сообщение #5


Дух форума
*

Группа: Пользователи
Сообщений: 19
Регистрация: 25.02.2018
Пользователь №: 31032



Много думала. Решение, предложенное Вами, прекрасно в своей простоте и универсальности. А ведь я читала страницу, ссылку на которую Вы привели... Вместо этого я изобретала велосипед... Прочитала несколько статей (к сожалению, без особой конкретики). Один из альтернативных подходов - разбить время наблюдения на несколько периодов.
Остается один вопрос: если есть несколько функций, которые могут "убрать" зависимость от времени, по какому признаку выбрать оптимальную?

Сообщение отредактировал Daria - 2.08.2018 - 22:39
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему