Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Многофакторный анализ, Кокс регрессия
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Гематолог
Дорогие форумчане!

Пожалуйста, посоветуйте!

Я постараюсь обрисовать проблему в общих чертах.

Выборка 500 больных - одно заболевание.

На этапе однофакторного анализа выделено 4 значимых фактора, влияющих на общую выживаемость.

Три из них - бинарные по своей природе - возраст - старше 45, младше 45 лет (1,0), пол и один лабораторный показатель (то же - выше определенного порога - 1, ниже - 0).
Четвертый - метод лечения - 1 - программа А, 0 - программа - В.

Моя проблема в следующем.

Когда я выполняю многофакторный Кокс - регр анализ для ТРЕХ факторов, исключая вид терапии, я получаю высокую значимость для выживаемости лабораторного параметра,
c соответствующим риском и ДИ.
И как бы все понятно.

Но. Если я включаю в модель терапию, то в окончательном уравнении наибольшая значимость появляется у фактора возраст, а лаборатоный параметр теряет свое значение.

Сразу оговорюсь - выбор терапии НАПРЯМУЮ не зависел от остальных трех параметров.
Это чтобы сразу мы не тратили время на обсуждение независимости включаемых параметров.

Я понимаю, что трактовка результатов многофакторного анализа не всегда банальная вещь.

Не прошу готовых рецептов, но надеюсь получить верное направление.

Спасибо всем откликнувшимся!
nokh
Цитата(Гематолог @ 16.02.2013 - 01:49) *
...
Не прошу готовых рецептов, но надеюсь получить верное направление.

Сложно сказать. Выборка хорошая, обнаруженные странности на малый объём не списать. Я бы попытался что-либо изменить и обсчитать модели с этими изменениями: может подсказка и придёт. Например, можно задать возраст не бинарно, а ввести исходные цифры; полагаю так будет даже грамотнее. Также можно попробовать исключить из анализа пол - показатель который совсем не "сработал". Ещё можно проверить: а не зависит ли от времени лабораторный показатель; если зависит нужно подбирать модель с зависящими от времени ковариатами. Как-то так.
DrgLena
Прежде всего, приветствую nokh на форуме, электричество, интернет, стекла и мысли на месте!

В отношении кокс модели, не вижу никаких логических проблем в описанной ситуации. В любой многомерной модели при введении нового предиктора, коэффициенты и оценки предыдущих предикторов пересматриваются и вполне вероятно, что метод лечения оказывает на выживаемость более сильное влияние, нежели лабораторный показатель, который к тому же используется в виде бинарной переменной. Точки разделения для бинарных предикторов могут быть пересмотрены. Кроме того они могут входить в модель и в виде количественных предиктора. Но, до моделирования посмотрите кривые К-М для двух методов лечения и для каждого предиктора . Посмотрите, возможно для одного метода важны одни факторы, а для другого они нет важны, или точки разделения сделайте ROC анализом для каждого метода лечения отдельно.
Гематолог
NOKH: Например, можно задать возраст не бинарно, а ввести исходные цифры; полагаю так будет даже грамотнее. Также можно попробовать исключить из анализа пол - показатель который совсем не "сработал". Ещё можно проверить: а не зависит ли от времени лабораторный показатель; если зависит нужно подбирать модель с зависящими от времени ковариатами.

Ответ. Спасибо большое!
Дело в том, как я отметил выше ? четыре показателя, включая пол, на этапе К-М, показали значимое влияние на ОВ. По этой причине, просто не включать пол в уравнение регрессии? как-то неверно будет, думаю.
Лабораторный показатель ? концентрация альбумина сыворотки крови ? фиксированный во времени показатель на момент верификации диагноза.

DrgLena: В любой многомерной модели при введении нового предиктора, коэффициенты и оценки предыдущих предикторов пересматриваются и вполне вероятно, что метод лечения оказывает на выживаемость более сильное влияние, нежели лабораторный показатель, который к тому же используется в виде бинарной переменной.

Ответ. Спасибо Вам! Может, дело в некоторой правильной расстановке акцентов на этапе трактовки результатов? Я включил в модель терапию, которая нивелирует лабораторный показатель, но, увы, не может ?сдвинуть? (пока, при моей выборке и пр.) с места влияние такой ?вечной ценности?, как возраст на момент постановки диагноза? :-))).
Но. Сам фактор ?терапия? в результате пошаговой процедуры становится незначимым.
Правильно ли я сделал, что вообще включил терапию в модель? (Еще раз ? по терапии, ОВ по К-М значимо различается)
Как трактовать отсутствие у нее статистической значимости в многомерной модели?

DrgLena: Точки разделения для бинарных предикторов могут быть пересмотрены. Кроме того они могут входить в модель и в виде количественных предиктора.

Ответ. За основу бинарного деления взята классическая работа по данной опухоли, где в окончательный многофакторный анализ вошли 1680 случаев и были предложены именно такие пороги деления количественных переменных.
То есть, в оригинальной работе количественные предикторы не использовались.

DrgLena: или точки разделения сделайте ROC анализом для каждого метода лечения отдельно.

Ответ. Несколько лет назад, я так и сделал. Построил кривую ROC относительно изучаемой ?неудачи терапии?. По отчету изменений Sp и Se нашел экстремальные точки.
Столкнулся с серьезной критикой редактора на предмет столь ?эзотерического? использования ROC-анализа. Из опубликованных статей в области онкологии/гематологии подобный способ деления количественных предикторов нашел, кажется, только в ОДНОЙ статье. Может, плохо искал ))).

Еще раз, Большое спасибо за отклик на мою задачу!
nokh
Цитата(DrgLena @ 16.02.2013 - 23:49) *
Прежде всего, приветствую nokh на форуме, электричество, интернет, стекла и мысли на месте!

Благодарю! Всё на месте кроме стёкол кое-где. У меня на работе в здании НИИ 7 выбило, но только одно насквозь, у жены - через окно насквозь. Из ближайшего окружения пострадали жена (стресс и синяк от вывалившейся рамы на плече), мама (2 балконные двери насквозь), тесть (синяк на лбу от оконной ручки), кот (сильный стресс: здания качались; отходил 2 суток). Много порезанных т.к. вспышку видели все без исключения и подошли к окнам разглядывать и фотографировать дымный след, а ударная волна только мин через 2-3 после вспышки дошла. А так даже сильных пробок на дорогах не образовалось. И паники не было, но долго был информационный вакуум - на местах никто не знал что делать и сотовая связь не работала...
По дисперсионному анализу напишу на почту как только раскидаю дела.

Цитата(Гематолог @ 17.02.2013 - 01:36) *
Ответ. Несколько лет назад, я так и сделал. Построил кривую ROC относительно изучаемой ?неудачи терапии?. По отчету изменений Sp и Se нашел экстремальные точки.
Столкнулся с серьезной критикой редактора на предмет столь ?эзотерического? использования ROC-анализа. Из опубликованных статей в области онкологии/гематологии подобный способ деления количественных предикторов нашел, кажется, только в ОДНОЙ статье. Может, плохо искал ))).

К сожалению, уровень редакторов бывает очень низок или узок. Поэтому не нужно слишком серьёзно относится к тому что они пишут. Я с мелкими замечаниями соглашаюсь через одно, а с крупными не бодаюсь, сразу ищу другой журнал. Возможно несколько лет назад и в гематологии это и было экзотикой, но собственно в онкологии, где есть вещественные опухоли с размерами, - нет. Очень удобно для практиков ориентироваться именно по таким бинарным показателям: больше какого-то значения или меньше. Сейчас статей много, можно найти на что ссылаться.
DrgLena
Уровень редакторов со временем, все же меняется. Я послала в 2005 году или в конце 2004 года статью в центральный киевский журнал ?Онкология? с использованием логистической регрессии, началась длинная и нудная переписка с редакцией, мне пытались объяснить, что в уравнение регрессии должны входить только переменные с нормальным распределением, про логистическую регрессию ничего не знали, я обстоятельно отвечала на вопросы, но переписка приняла вялотекущее течение и я расценила это как завуалированный отказ от публикации. Статья была послана в Москву и опубликована в РМЖ в 2005, но в 2006 году статья также вышла и в Киеве, о чем я узнала случайно. В РМЖ очень много ошибок редакции, подправили по своему усмотрению, не согласовав с автором.

По поводу оценок предикторов в кокс регрессионных моделях, я использую в виде количественных переменных ? выстояние и протяженность опухоли, возраст постановки диагноза, бинарный ? пол, а категориальные переменные локализация и гистологический клеточный тип в трех и четырех градациях соответстенно.
Для создания такой модели не подходит программа Statistica.
p2004r
Цитата(Гематолог @ 15.02.2013 - 22:49) *
Выборка 500 больных - одно заболевание.

На этапе однофакторного анализа выделено 4 значимых фактора, влияющих на общую выживаемость.

Три из них - бинарные по своей природе - возраст - старше 45, младше 45 лет (1,0), пол и один лабораторный показатель (то же - выше определенного порога - 1, ниже - 0).
Четвертый - метод лечения - 1 - программа А, 0 - программа - В.

Моя проблема в следующем.

Когда я выполняю многофакторный Кокс - регр анализ для ТРЕХ факторов, исключая вид терапии, я получаю высокую значимость для выживаемости лабораторного параметра,
c соответствующим риском и ДИ.
И как бы все понятно.

Но. Если я включаю в модель терапию, то в окончательном уравнении наибольшая значимость появляется у фактора возраст, а лаборатоный параметр теряет свое значение.

Сразу оговорюсь - выбор терапии НАПРЯМУЮ не зависел от остальных трех параметров.
Это чтобы сразу мы не тратили время на обсуждение независимости включаемых параметров.



Например если "метод лечения 1" вызвал большинство сдвигов "лабораторного показателя", а "метод лечения 2" вызвал мало, то именно такая картина и будет.
Гематолог
Цитата(p2004r @ 22.02.2013 - 10:38) *
Например если "метод лечения 1" вызвал большинство сдвигов "лабораторного показателя", а "метод лечения 2" вызвал мало, то именно такая картина и будет.



Понял. То есть, Вы советуете еще раз проверить группы "терапия 1" и "терапия 2" на сбалансированность по фактору "лабораторный показатель"...
Гематолог
Цитата(DrgLena @ 18.02.2013 - 22:27) *
Уровень редакторов со временем, все же меняется. Я послала в 2005 году или в конце 2004 года статью в центральный киевский журнал ?Онкология? с использованием логистической регрессии, началась длинная и нудная переписка с редакцией, мне пытались объяснить, что в уравнение регрессии должны входить только переменные с нормальным распределением, про логистическую регрессию ничего не знали, я обстоятельно отвечала на вопросы, но переписка приняла вялотекущее течение и я расценила это как завуалированный отказ от публикации. Статья была послана в Москву и опубликована в РМЖ в 2005, но в 2006 году статья также вышла и в Киеве, о чем я узнала случайно. В РМЖ очень много ошибок редакции, подправили по своему усмотрению, не согласовав с автором.

По поводу оценок предикторов в кокс регрессионных моделях, я использую в виде количественных переменных ? выстояние и протяженность опухоли, возраст постановки диагноза, бинарный ? пол, а категориальные переменные локализация и гистологический клеточный тип в трех и четырех градациях соответстенно.
Для создания такой модели не подходит программа Statistica.


Спасибо большое, Елена, за совет и за прикрепленный файл!

Взятие бинарных факторов было продиктовано использованным дизайном одной из зарубежых исследовательских групп.
Что касается содержательной части интерпретации, то иногда ведь не так важно, во сколько раз возрастет относительный риск при изменении,
скажем концентрации ЛДГ на одну единицу...
И большинство международных прогностических систем построены на определенных категориальных (в т.ч. бинарных) параметрах.
Так вот, я НИГДЕ не встретил внятного формализованного объяснения, как для количественных переменных подбирают cut off.
Подчас это делается волевым образом и произвольно.
Ранее, на форуме, мне посоветовали ROC-анализ.
Я сделал это для одной из работ.
Речь шла о влиянии изменения концентрации препарата (нормально распределенная величина) на неудачи терапии.
Но. Параллельно я искал в литературе, применялся ли ROC для подобных задач.
Не нашел. Возможно, плохо искал :-)
Принципиально редактор не был против.
Но вполне здраво попросил меня ссылочку, поскольку о ROC-анализе и логистической регрессии имел представление...

Еще раз спасибо!




p2004r
Цитата(Гематолог @ 22.02.2013 - 18:01) *
Понял. То есть, Вы советуете еще раз проверить группы "терапия 1" и "терапия 2" на сбалансированность по фактору "лабораторный показатель"...


да, например просто mosaicplot() по данным построить и посмотреть глазами при разном варианте построения графика.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.