Здравствуйте!
При выполнении анализа один из предикторов (категориальный, три уровня) связан со временем, что нарушает предположении о пропорциональности. Это я вполне ожидала. Диагностику проводила при помощи процедуры оценки остатков Шонфельда в Стата (phtest). Затем я в модели задала взаимодействие этого предиктора со временем (чисто эпмирически "ln(_t)"). В результате этот предиктор также статистически значимо влиял на исход. Однако, Стата не дает провести анализ остатков Шонфельда с таким взаимодействием (tvc): "this post-estimation command is not allowed after estimation with tvc();
see tvc note for an alternative to the tvc() option". В справке описан способ, как создать новую переменную, которая будет представлять собой такой взаимодействие. Однако остались вопросы.
Вопросы:
1. Как установить, как именно предиктор связан со временем (логарифмически, степенной функцией?)? Создать несколько моделей, потом сравнить их между собой?
2. Могу ли я потом, используя такую модель, построить кривую выживаемости при определенных значениях ковариат?
Очень рассчитываю на вашу помощь.
Почти 150 просмотров и нет ответов... Никто действительно не знает или причина в чем-то другом?
Доброе утро!
Спасибо большое за подробный ответ!
Сделала как Вы сказали - зависимость от времени пропала! Просто я в процессе экспериментов пробовала разные взаимодействия: р*(1/exp(_t)) или даже d*(1/ln(-0.1226*_t^2 + 0.6323*_t + 0.6958)). Указала только те, которые "сработали". Первое нашла также эмпирически, а второе - прикинула отношение рисков для разных значений признака на трех временных точках, построила график в экселе, получила тренд в виде квадратичной функции (r^2=1) и взяла обратную ей (уж не знаю, насколько я была права, сделала это уже от отчаяния). Все три подхода дали ожидаемый результат, а как выбрать из них оптимальный? По какому признаку?
Много думала. Решение, предложенное Вами, прекрасно в своей простоте и универсальности. А ведь я читала страницу, ссылку на которую Вы привели... Вместо этого я изобретала велосипед... Прочитала несколько статей (к сожалению, без особой конкретики). Один из альтернативных подходов - разбить время наблюдения на несколько периодов.
Остается один вопрос: если есть несколько функций, которые могут "убрать" зависимость от времени, по какому признаку выбрать оптимальную?
Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)