![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 49 Регистрация: 7.04.2010 Пользователь №: 15366 ![]() |
Добрый день! Помогите разобраться. Имеются данные для анализа выживаемости:
время (месяцы), событие (рецидив или нет), независимые ковариаты 3 переменных - 1. дифференцировка - бинарная (низкодифференированныя и умеренно+высокодифференцированная) 2. уровень РЭА до операции 3. количество метастазов Они остались в результате применения регрессионного анализа Кокса в СПСС. Т.е. я понимаю что можно сделать выводы, что такие то факторы значимо влияют на продолжительность безрецидивной жизни, какой из них более значим. Могу ли я применить это как-то в плане прогнозирования продолжительности безрецидивной жизни? (как например в логистической регрессии). Это пожалуй основной вопрос. Цель исследования не только выявить исходные факторы, влияющие на продолжительность безрецидивного течения, но и иметь возможность прогнозировать это время для любого конкретного больного. Привожу формулу h(t)=h0(t) *exp(b1z1+...+bmzm) В СПСС есть функция сохранить: функция риска - это h(t)? Для 2 больных проживших 1 мес у одного 2,1 а другого 0,6. О чем это говорит? Максимум 4,3 минимум 0,2 - это много или мало. Как мне найти h0(t) - базовая функция риска при нулевых ковариатах (нулевые это равные 0?) и нужно ли это? С экспоненциальной регрессией более понятно, но у меня время жизни распределено не экспоненциально. В Attestat сделала подгонку распределения: получилось логлогистическое. Что мне с ним делать?! |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 49 Регистрация: 7.04.2010 Пользователь №: 15366 ![]() |
[С переменными: количество метастазов не совсем ясно, т.е. они были до операции или выявлены после?]
Метастазы были выявлены до операции. Прогрессия конечно же после операции. 1 - прогрессия есть 0 - прогрессии нет. Сроки разные потому что были выбывшие по неизвестным причинам пациенты (цензуированные данные). Все размеры суммарные и количество взяты до операции. То что суммарное количество не совпадает для меня новость, может быть при копировании что-то не так было. Давайте от V10 пока абстрагируемся (я пересмотрю данные поищу ошибку). И наконец задачи следующие 1. выявить факторы наиболее значимо влияющие на безсобытийную выживаемость (событие - прогрессия), время развития прогрессии - с этим я вроде бы справилась. 2. по полученной зависимости иметь возможность прогнозировать среднее предполагаемое время жизни без прогрессии для каждого конкретного пациента (хотелось бы как в логистической регрессии получить некое уравнение, при подстановке в которое значений предикторов получать это самое время). В идеале хотелось бы оценить потом эту модель на другой выборке с вытекающими отсюда последствиями. Например, столько -то правильных предсказаний, столько неправильных, специфичность, чувствительность. Но тут я не знаю возможно ли подобное. Например у нас пациент прожил без прогрессии 3 месяца а модель предсказывает 7 месяцев - это правильное предсказание или нет, а у другого который прожил 3 месяца - предсказывает 18 месяцев - ну это понятно будет неправильно. Может быть должны быть какие-то доверительные интервалы по которым ориентироваться на правильность предсказаний. Еще момент как проверить: вообще применима ли к моим данным регрессия Кокса? (должно соблюдаться условие пропорциональности риска - как проверить) Спасибо!!! |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 63 Регистрация: 20.03.2012 Из: Ташкент Пользователь №: 23582 ![]() |
[С переменными: количество метастазов не совсем ясно, т.е. они были до операции или выявлены после?] Метастазы были выявлены до операции. Прогрессия конечно же после операции. 1 - прогрессия есть 0 - прогрессии нет. Сроки разные потому что были выбывшие по неизвестным причинам пациенты (цензуированные данные). Все размеры суммарные и количество взяты до операции. Ясно, значит все, кроме прогрессии и сроков до выявления прогрессии относится к данным до операции. То что суммарное количество не совпадает для меня новость, может быть при копировании что-то не так было. Давайте от V10 пока абстрагируемся (я пересмотрю данные поищу ошибку). Где-то действительно закрались ошибки, т.к. если например, взять ячейку J5, то в ней указано количество 5, а в ячейках E5 = 5, F5 = 1 и G5 = 1, что в сумме должно дать 7, а никак не 5. И наконец задачи следующие 1. выявить факторы наиболее значимо влияющие на безсобытийную выживаемость (событие - прогрессия), Можно. время развития прогрессии - с этим я вроде бы справилась. Тоже разрешимо 2. по полученной зависимости иметь возможность прогнозировать среднее предполагаемое время жизни без прогрессии для каждого конкретного пациента (хотелось бы как в логистической регрессии получить некое уравнение, при подстановке в которое значений предикторов получать это самое время). Только в данной задаче адекватно время не получать, а задавать в качестве таймерного события. В идеале хотелось бы оценить потом эту модель на другой выборке с вытекающими отсюда последствиями. Например, столько -то правильных предсказаний, столько неправильных, специфичность, чувствительность. Но тут я не знаю возможно ли подобное. Это уже не идеал, а тест на эргодичность. Если математическая модель строится для неэргодичной среды, то вне выборки она может дать статистически незначимые результаты, т.е. эксперимент будет нерепродуицируем. Например у нас пациент прожил без прогрессии 3 месяца а модель предсказывает 7 месяцев - это правильное предсказание или нет, а у другого который прожил 3 месяца - предсказывает 18 месяцев - ну это понятно будет неправильно. Неправильно предсказывать точное время вероятностных событий если они недостоверны. Например, из немного другой области, скажем в спорте, можно с помощью распределения Пуассона при известной среднестатистической забиваемости командой количества мячей в чужие ворота за 90 минут матча, рассчитать вероятность того что эта же команда в следующем матче не забьет ни одного гола либо вероятность того, что она забьет 10 мячей. Причем распределение Пуассона статистически значимо и в хоккее и в футболе. Точно также и в данном случае, можно только по факторам вычислить вероятность того, что пациент проживет без рецидива некий наперед заданный срок, например, месяц, два месяца, квартал, полугодие или год. Такова особенность теории вероятностей и статистики - оперировать вероятностными величинами для событий, а не конкретными сроками от одного события до другого. Сколько пройдет времени у конкретного пациента до рецидива точно вычислить невозможно. Чтобы было проще понять, почему так происходит, подбросьте 10 раз монету. Она может выпасть орлом и 10 раз подряд и решкой 10 раз подряд. Вероятности для вышеуказанных обоих событий при условии правильной монеты равны 1 / 1024. Т.е. предсказать сколько раз подряд монета может выпасть орлом в следующей серии подбрасываний невозможно, но угадать либо не угадать с той или иной вероятностью можно. Может быть должны быть какие-то доверительные интервалы по которым ориентироваться на правильность предсказаний. Еще момент как проверить: вообще применима ли к моим данным регрессия Кокса? (должно соблюдаться условие пропорциональности риска - как проверить) Спасибо!!! Любую модель можно перепроверить на эргодичность только на независимой выборке и только после такой проверки уже решать вопросы применимости или неприменимости. Тем паче что один и тот же метод математического моделирования может иметь несколько допустимых решений (например, в задаче оптимизации на отдельно взятой выборке может быть несколько экстремумов и лишь один или более из них эргодичны независимо от выборки, а можеть быть, что и ни одного эргодичного не будет выявлено). В общем и в целом все понятно, за исключением некоторых ошибок и неточностей в исходных данных. А ошибки в исходных - не есть хорошо, т.к. запросто можно обнаружить черную кошку в темной комнате, несмотря на то, что ее там никогда не было. Сообщение отредактировал YVR - 13.04.2012 - 21:55 ![]() Yury V. Reshetov |
|
![]() |
![]() |
![]() ![]() |