Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Cutoff в прогностических моделях
Гематолог
сообщение 5.04.2010 - 11:09
Сообщение #1





Группа: Пользователи
Сообщений: 33
Регистрация: 17.08.2009
Пользователь №: 6249



Дорогие друзья, нуждаюсь в помощи!

Как решить проблему cutoff, когда речь идет о количественной переменной, оказавшей
в Кокс-регрессивном анализе значимое влияние на выживаемость?
Например, Вы имеете 200 значений уровня ЛДГ (лактат-дегидрогеназы) у своих пациентов в виде колонки.
Далее, Кокс-регрессия показывает значимое влияние параметра на общую и бессобытийную выживаемость.
Вопрос. Как грамотно определить границу значения переменной?
Скорее всего Вы видели, как в прогностических индексах выделяют группы:

ЛДГ более 600 и менее 600.
Альбумин более 30 и менее 30 и т.д.

Я искал ответ по публикациям, где подобную задачу решали.
Привожу ниже рецепт от Немецкой группы по изучению лимфогранулематоза -

To develop a practical scoring system, all laboratory variables
were dichotomized. Cutoff points were chosen to make optimal
use of the information, with the conditions that the smaller
group contain at least 20 percent of all patients, that the cutoff
value demarcate a clearly abnormal state and if possible agree with
cutoff values used in the literature, and that the effects of the dichotomized
variables be of the same order of magnitude. No
dichotomized covariates were entered into the model unless the
continuous analogue had a significant independent prognostic effect.
This strategy was used to ensure that the selection of prognostic
factors for the model would be independent of the choice
of the various cutoff points.

Спасибо за помощь заранее!


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 8.04.2010 - 04:56
Сообщение #2





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



В анализе выживаемости с такой задачей не сталкивался, но искал оптимальную точку разделения в анализе диагностической эффективности (ДЭ). Там пришлось это делать вручную - провести столько анализов, сколько в данных есть точек-кандидатов на cutoff и для каждой рассчитать интегральную меру ДЭ (использовал индекс Юдена). Далее по графику, который был близок к параболе нашёл значение cutoff в её вершине. Работа большая, но в данном случае была оправдана, т.к. от выбора этой точки в новой методике в целом и диссертации человека в частности многое зависело. Думаю что и в Вашем случае стандартные пакеты не предоставят возможности автоматического расчёта порога, разве что в R это вероятно можно запрограммировать. Но если трудозатраты оправданы можно попытаться также сделать вручную. Я бы в качестве интегральной меры использовал отношение рисков. Т.е. для окончательной модели все переменные не изменять а одну, скажем ЛДГ, перевёл бы в бинарную выбрав качестве порога первое изменение её уровня в массиве данных и из результатов анализа выписал бы соответствующее этой переменной значение отношения рисков. Затем перевёл бы в бинарную по следующему порогу и т.д. Данные предварительно бы отсортировал в порядке увеличения ЛДГ - для облегчения кодировки соседней колонки в которой она будет бинарной и которая и будет использована в анализе. После проведения всех анализов построил бы график зависимости отношения рисков от величины порога переменной. После разбора первой переменной приступил бы к дихотомизации другой.
Далее - неопределённость. В моём случае я точно знал, что у функции есть вершина. В вашем такой вершины не будет, а будет только возрастание функции отношения рисков. Если повезёт - она будет иметь форму логистической кривой или по крайней мере иметь явную точку перегиба. Тогда её можно будет приблизить к/л известной функцией, получить уравнение и алгебраически рассчитать абсциссу точки перегиба - это и будет искомый оптимальный порог - то значение после которого происходит качественный скачок в выживаемости. Но можно предположить что Ваша функция не будет иметь такой точки перегиба - например это будет просто уходящая вверх прямая. Тогда любые попытки введения какого-либо порога представляются необоснованными, т.к. влияние переменной на выживаемость будет монотонным. В принципе - тоже интересно, и тоже - вывод. Такие вот есть соображения.

Сообщение отредактировал nokh - 8.04.2010 - 05:04
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Гематолог   Cutoff в прогностических моделях   5.04.2010 - 11:09
- - nokh   В анализе выживаемости с такой задачей не сталкива...   8.04.2010 - 04:56
- - Гематолог   Спасибо, Уважаемый Nokh! К этому сообщению я ...   11.04.2010 - 19:58
- - mix3d   А нельзя ли в данном случае применить ROC-анализ?   22.04.2010 - 17:43
- - DrgLena   Используя ROC можно найти точки разделения количес...   23.04.2010 - 12:39
|- - Гематолог   Цитата(DrgLena @ 23.04.2010 - 13:39)...   26.04.2010 - 09:55
- - DrgLena   Цитата(Гематолог @ 26.04.2010 - 09:5...   26.04.2010 - 12:39
- - Гематолог   Спасибо, Елена! Я не приводил всю таблицу, по...   26.04.2010 - 21:35
- - DrgLena   1. ROC, вы нашли точку разделения, значение >4...   27.04.2010 - 01:42
- - Гематолог   Спасибо, Елена! Вы правы, если закладывать би...   27.04.2010 - 08:32
- - DrgLena   Цитата(Гематолог @ 27.04.2010 - 08:3...   27.04.2010 - 12:37
- - Гематолог   Это правда - возможности SPSS иногда расходятся с ...   27.04.2010 - 13:05
- - Гематолог   Ура! С ROC - разобрался. Моя проблема и вопрос...   28.04.2010 - 08:51
- - Игорь   Цитата(Гематолог @ 28.04.2010 - 09:5...   28.04.2010 - 10:44


Добавить ответ в эту темуОткрыть тему