Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Cutoff в прогностических моделях
Гематолог
сообщение 5.04.2010 - 11:09
Сообщение #1





Группа: Пользователи
Сообщений: 33
Регистрация: 17.08.2009
Пользователь №: 6249



Дорогие друзья, нуждаюсь в помощи!

Как решить проблему cutoff, когда речь идет о количественной переменной, оказавшей
в Кокс-регрессивном анализе значимое влияние на выживаемость?
Например, Вы имеете 200 значений уровня ЛДГ (лактат-дегидрогеназы) у своих пациентов в виде колонки.
Далее, Кокс-регрессия показывает значимое влияние параметра на общую и бессобытийную выживаемость.
Вопрос. Как грамотно определить границу значения переменной?
Скорее всего Вы видели, как в прогностических индексах выделяют группы:

ЛДГ более 600 и менее 600.
Альбумин более 30 и менее 30 и т.д.

Я искал ответ по публикациям, где подобную задачу решали.
Привожу ниже рецепт от Немецкой группы по изучению лимфогранулематоза -

To develop a practical scoring system, all laboratory variables
were dichotomized. Cutoff points were chosen to make optimal
use of the information, with the conditions that the smaller
group contain at least 20 percent of all patients, that the cutoff
value demarcate a clearly abnormal state and if possible agree with
cutoff values used in the literature, and that the effects of the dichotomized
variables be of the same order of magnitude. No
dichotomized covariates were entered into the model unless the
continuous analogue had a significant independent prognostic effect.
This strategy was used to ensure that the selection of prognostic
factors for the model would be independent of the choice
of the various cutoff points.

Спасибо за помощь заранее!


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
DrgLena
сообщение 23.04.2010 - 12:39
Сообщение #2





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Используя ROC можно найти точки разделения количественной переменной для разделения двух групп, например больной ? здоровый. И затем, использовать в логистической регрессионной модели полученные таким образом бинарные переменные. Но в кокс регрессионных моделях событие (рецидив, смерть) происходи во времени и в качестве оценки влияния фактора используют exp(в). Если предикторы количественные, то можно построить К-М кривую по средним значениям предикторов (базовый риск), эти средние делят на две части переменную и бинарные могут быть созданы на основе средних. Трактовка exp(в) тогда означает величину влияния фактора, если он есть 1, нет 0. Для усиления оценки риска можно сделать несколько категорий количественной переменной и рассмотреть, например 1 категорию (1) относительно 2+3+4 (0). Тогда, наиболее крайние значения будут обладать более высоким риском и exp(в) будет выше. Но в этой меньшей группе не должно быть слишком мало значений, например не менее 20% всех случаев. Это, если одна переменная в модели, но если их несколько, то нужно смотреть и другие варианты, т.е. 1+2 против 3+4 может иметь достаточно высокую оценку при наличии еще и другого фактора риска. В итоге - мучительное моделирование, чтобы в модель вошли наиболее значимые факторы, не коррелируемые друг с другом и обладающие биологическим смыслом.

Сообщение отредактировал DrgLena - 23.04.2010 - 12:44
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Гематолог
сообщение 26.04.2010 - 09:55
Сообщение #3





Группа: Пользователи
Сообщений: 33
Регистрация: 17.08.2009
Пользователь №: 6249



Цитата(DrgLena @ 23.04.2010 - 13:39) *
Используя ROC можно найти точки разделения количественной переменной для разделения двух групп, например больной ? здоровый. И затем, использовать в логистической регрессионной модели полученные таким образом бинарные переменные. Но в кокс регрессионных моделях событие (рецидив, смерть) происходи во времени и в качестве оценки влияния фактора используют exp(в). Если предикторы количественные, то можно построить К-М кривую по средним значениям предикторов (базовый риск), эти средние делят на две части переменную и бинарные могут быть созданы на основе средних. Трактовка exp(в) тогда означает величину влияния фактора, если он есть 1, нет 0. Для усиления оценки риска можно сделать несколько категорий количественной переменной и рассмотреть, например 1 категорию (1) относительно 2+3+4 (0). Тогда, наиболее крайние значения будут обладать более высоким риском и exp(в) будет выше. Но в этой меньшей группе не должно быть слишком мало значений, например не менее 20% всех случаев. Это, если одна переменная в модели, но если их несколько, то нужно смотреть и другие варианты, т.е. 1+2 против 3+4 может иметь достаточно высокую оценку при наличии еще и другого фактора риска. В итоге - мучительное моделирование, чтобы в модель вошли наиболее значимые факторы, не коррелируемые друг с другом и обладающие биологическим смыслом.


Спасибо большое, Елена!
Ей Богу, ROC не использовал.
Столкнулся с двумя проблемами в Кокс - регрессии...
Но постараюсь пока сформулировать первый вопрос.
Если Вас не затруднит, посмотрите прикрепленный файл.
Там таблица. Файл не экселевский, потому что сайт, почему - то не разрешил прикрепить файл с эксель расширением.
Пришлось представить его в word.
В одной колонке, по ранжиру, представлены в месяцах периоды ожидания до воздействия
препарата А. Всего - 81 пациент.
Во второй колонке - бинарная переменная -
1 - удача
2 - неудача.
Мой вопрос.
Я вижу, что при ожидании более 4 месяцев возросло число нулей, то есть неудач.
Каким методом это наблюдение формализовать и доказать?
В файле Вы увидете данные и на стр 3 - 4 результаты тех методов, что применил я.
Правильно ли я использовал методы?
Если моя проблема вызовет отклик у Уважаемых экспертов, я спрошу о другой проблеме.
Спасибо за сайт и за помощь!!!

Прикрепленные файлы
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Гематолог   Cutoff в прогностических моделях   5.04.2010 - 11:09
- - nokh   В анализе выживаемости с такой задачей не сталкива...   8.04.2010 - 04:56
- - Гематолог   Спасибо, Уважаемый Nokh! К этому сообщению я ...   11.04.2010 - 19:58
- - mix3d   А нельзя ли в данном случае применить ROC-анализ?   22.04.2010 - 17:43
- - DrgLena   Используя ROC можно найти точки разделения количес...   23.04.2010 - 12:39
|- - Гематолог   Цитата(DrgLena @ 23.04.2010 - 13:39)...   26.04.2010 - 09:55
- - DrgLena   Цитата(Гематолог @ 26.04.2010 - 09:5...   26.04.2010 - 12:39
- - Гематолог   Спасибо, Елена! Я не приводил всю таблицу, по...   26.04.2010 - 21:35
- - DrgLena   1. ROC, вы нашли точку разделения, значение >4...   27.04.2010 - 01:42
- - Гематолог   Спасибо, Елена! Вы правы, если закладывать би...   27.04.2010 - 08:32
- - DrgLena   Цитата(Гематолог @ 27.04.2010 - 08:3...   27.04.2010 - 12:37
- - Гематолог   Это правда - возможности SPSS иногда расходятся с ...   27.04.2010 - 13:05
- - Гематолог   Ура! С ROC - разобрался. Моя проблема и вопрос...   28.04.2010 - 08:51
- - Игорь   Цитата(Гематолог @ 28.04.2010 - 09:5...   28.04.2010 - 10:44


Добавить ответ в эту темуОткрыть тему