Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Калибровка номограммы
pdemeshko
сообщение 19.09.2013 - 15:45
Сообщение #1





Группа: Пользователи
Сообщений: 8
Регистрация: 14.05.2012
Пользователь №: 23756



Уважаемые коллеги! Необходимо создать калибровочный график для предсказанных вероятностей при проведении внешней валидизации номограммы. Поиск показал, что похоже это можно сделать с помощью r, используя пакет rms. Есть набор данных из 2 вариант - бинарный признак и вероятность в %. может кто подскажет код? или другой пакет, где это можно сделать?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 26.09.2013 - 14:04
Сообщение #2





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Характер распредления кружков на графике говорит о возможной гетерогенности групп, по крайней мере "0". Посмотрел плотность распредления вероятности отдельно для 0 и 1, благо объём выборки позволяет. Начну с номограммы 2, т.к. насколько понял, именно она рекомендована сейчас. На рис. по оси х отложил десятичные логарифмы вероятностей, опираясь на число мод на графиках плотностей провёл разделение смеси распределений. Что имеем?
(1) У вас не 2, а 3 группы объектов, об этом говорят сами данные. Теоретически это плохо, поскольку вы хотите делить пациентов только на 2. Причём эти 3 группы обнаруживаются с использованием и первой и второй номограммы, только качесто разделения различное. Наличие трёх групп говорит о том, что в номограмме с сайта упущен какой-то важный качественный показатель или он присущ только вашей выборке. В любом случае это нехорошо.
(2) На примере номограммы 2 (рис ниже) посмотрим как работаеи номограмма. Сразу видно что плохо: 3 класса присутствуют и в группе, относимой к 0, и в группе, относимой к 1. В группе "0" больше пациентов певрого кластера - с минимальной вероятностью. В группе "1" их гораздо меньше, но они тем не менее есть. Соответственно меняется пропорция и в кластерах 2 (промежуточный) и 3 (высокая вероятность), но только пропорция, причём в большей степени в промежуточном кластере 2. Судя по изменению соотношений мне представляется, что пациенты без метастазов сосредоточены в кластере 1, а с метастазами - в кластерах 2 и 3.
(3) Насколько я понял, онлайновая номограмма позволяет рассчитать вероятность после внесения некого набора данных о пациенте. При этом раз она "заточена" на деление на 2 группы, то пороговое значение будет 0,5. Я провёл эту линию пунктиром. Видно, что она разделяет кластеры (1+2) vs 3, но не 1 vs (2+3). Хотя логичнее провести её в районе (-0,9), что после перехода от логарифмической шкалы к исходным вероятностям даёт 0,126. Т.о. полагаю, что уж если задаться целью использовать именно номограмму, то деление на группы лучше проводить с использованием в качестве порогового значения вероятности около 0,13, а не 0,5 (проверять расчётами лень).

Если проделать такой же анализ с номограммой 1, то результаты будут иными, но по крайней мере группа "1" будет однородной унимодальной, а не тримодальной как в номограмме 2. А вот группа "0" будет тримодальной, с последним третим кластером, соответствующим группе "1". Но его трансгрессия с промежуточным кластером 2 очень велика.

Всё в целом производит впечатление того, что здесь уместнее говорить не о валидности, а об "инвалидности" подхода с использованием готовых номограмм, особенно второй. Здесь не помогут ни байесовские сети, ни бутстрэп, т.к. в расчёт самой номограммы не включено что-то очень важное. Уверен, что вдумчивый анализ исходных показателей позволит построить модель, учитывающую 3 состояния пациентов и площадью под характеристической кривой куда больше 0,795.

Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
pdemeshko
сообщение 26.09.2013 - 16:08
Сообщение #3





Группа: Пользователи
Сообщений: 8
Регистрация: 14.05.2012
Пользователь №: 23756



все верно, обе номограммы страдают от инвалидности:), что дает нам обосгование необходимости разработки новой. Но это вершина айсберга. На втором этапе мне нужно ответить на вопрос, на сколько хорошо производилось отнесение пациентов к группам 0 и 1, т.е. различался объем хирургического удаления лимфоузлов в нашей группе и в той популяции на которй тренировали номограмму2., которым выполняли так называемую расширенную лимфаденэктомию с удалением большего количества лимфоузлов. у нас может быть баис. А может и нет
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему