Форум врачей-аспирантов > Сравнение параметров диагностических методов

Makovec

7.02.2012 - 15:59

Есть группа пациентов (73 больных) с узловыми образованиями ЩЖ, все прооперированы и имеют заключения гистологич. исследования о присутствии или отсутствии рака (золотой стандарт). Всем проведены дооперационные диагностические мероприятия (ТАБ, УЗИ, сцинтиграфия). Уже вычислены чувствительность, точность и специфичность каждого метода, а также чувствительность / специфичность при выявлении отдельных гистологических типов. Пожалуйста, помогите определиться с критериями сравнения эффективности этих методов. Допустим наши общие показатели по чувствительности, точности и специфичности составили: для УЗИ (86,4%, 80,8% 57,1%) , ТАБ (89,8 %, 89,0% и 85,7 %) и сцинтиграфии (93,2%, 86,3%, 57,1 %). Можно ли их сравнивать "тройками" или по-отдельности каждый из параметров? Мы сначала сравнивали Манном-Уитни, но потом нам сказали пересчитать все методом сравнения пропорций. И ище нужно сравнить эффективность данных методов отдельно для разных половозрастных групп. Пожалуйста, подскажите, как это лучше сделать? Заранее спасибо!

p2004r

7.02.2012 - 19:25

Цитата(Makovec @ 7.02.2012 - 15:59)

Есть группа пациентов (73 больных) с узловыми образованиями ЩЖ, все прооперированы и имеют заключения гистологич. исследования о присутствии или отсутствии рака (золотой стандарт). Всем проведены дооперационные диагностические мероприятия (ТАБ, УЗИ, сцинтиграфия). Уже вычислены чувствительность, точность и специфичность каждого метода, а также чувствительность / специфичность при выявлении отдельных гистологических типов. Пожалуйста, помогите определиться с критериями сравнения эффективности этих методов. Допустим наши общие показатели по чувствительности, точности и специфичности составили: для УЗИ (86,4%, 80,8% 57,1%) , ТАБ (89,8 %, 89,0% и 85,7 %) и сцинтиграфии (93,2%, 86,3%, 57,1 %). Можно ли их сравнивать "тройками" или по-отдельности каждый из параметров? Мы сначала сравнивали Манном-Уитни, но потом нам сказали пересчитать все методом сравнения пропорций. И ище нужно сравнить эффективность данных методов отдельно для разных половозрастных групп. Пожалуйста, подскажите, как это лучше сделать? Заранее спасибо!

Можно сравнивать сами ROC .

пакет http://web.expasy.org/pROC/

roc.test

This function compares the AUC or partial AUC of two correlated (or paired) or uncorrelated (unpaired)
ROC curves. Several syntaxes are available: two object of class roc (which can be AUC or
smoothed ROC), or either three vectors (response, predictor1, predictor2) or a response vector and
a matrix or data.frame with two columns (predictors).

roc.test(roc1, roc2, method=c("delong", "bootstrap",
"venkatraman", "sensitivity", "specificity"), sensitivity = NULL,
specificity = NULL, alternative = c("two.sided", "less", "greater"),
paired=NULL, reuse.auc=TRUE, boot.n=2000, boot.stratified=TRUE,
ties.method="first", progress=getOption("pROCProgress")$name, ...)

Makovec

7.02.2012 - 21:11

Спасибо. как же с этим разобраться?

А другого способа, через уровень значимости, никакого нет?

DrgLena

7.02.2012 - 21:55

Можно пойти и другим путем, если вы не можете построить ROC и сравнить их. Вам советовали пересчитать все методом сравнения пропорций. Proportion переводится не только как пропорция, а как доля. Если у вас 73 больных разделены ?золотым стандартом?, то вы точно знаете сколько ?хороших? и сколько ?плохих?. Рассматривайте только чувствительность и специфичность без лишней информации об общей точности теста, в операционных характеристиках теста ее обычно не рассматривают. Вы должны оценить статистически разницу между числом больных с плохим диагнозом выявленных по золотому стандарту и по каждому тесту, т.е.нужно оценить разницу больных с плохим и с хорошим диагнозом, как долю относительно общего числа больных. Эту долю выражают в процентах, а для оценки разницы используют критерий Мак-Немара. Это критерий для связанных выборок, анализирующий диагональ четырехпольной таблицы. На этом форуме его подробно рассматривали. Если не понятно, выложите абсолютные числа на которых вы посчитали чувствительность и специфичность, и как разделилась общая группа по золотому стандарту.

p2004r

7.02.2012 - 22:09

Цитата(Makovec @ 7.02.2012 - 21:11)

Спасибо. как же с этим разобраться?

А другого способа, через уровень значимости, никакого нет?

это и есть тест, он возвращает
p.value --- the p-value of the test.

в него можно прямо подать response, predictor1, predictor2. То есть для каждого случая есть точный диагноз, и значения сравниваемых диагностических методов.

вот пример использования пакета для построения доверительных интервалов.
http://forum.disser.ru/index.php?showtopic...ost&p=12550

хотите давайте посмотрим на ROC которые насчитает пакет для Ваших данных.

Makovec

7.02.2012 - 22:35

спасибо огромное, что откликнулись, DrgLena и p2004г, появилась надежда

)

Истинно положительные (ИП) - Ложно-положительные(ЛП) - Истинно отрицательные(ИО) - Ложно- отрицательны(ЛО)

УЗИ:
51 6 8 8

ТАБ
53 2 12 6

сцин:
55 6 8 4.

Makovec

7.02.2012 - 22:40

(гистология, зол. стандарт): злокачестенных (+) - 59, доброкач. (-) 14.

DrgLena

7.02.2012 - 23:53

По УЗИ не диагностировано плохих по сравнению с золотым стандартом 8 больных (59-51), что составляет 11% от общего числа больных, 95% ДИ (3,8%-18,1%), эта разница статистически значима по критерию М-Н (CHI=6,13 р= 0.013).

По ТАБ разница по выявлению плохих составляет 6 больных, М-Н Chi2: =4.17 (p= 0.041), что составляет 8,2% (95% ДИ 1,9%-14,5%).

По сцин эта разница с золотым стандартом только 4 больных М-Н Chi2= 2.25 (p= 0.133), что составляет 5,5% (95% ДИ 0,3%-10,7%).

Т.о. по способности выявлять зло сцин не уступает по чувствительности золотому стандарту, остальные два уступают.

Однако, по специфичности сцин уступает золотому стандарту, как и узи, но ТАБ не уступает.

По критерию М-Н почитайте Реброву, формула очень простая, есть обсуждение на этом форуме, труднее посчитать ДИ к разнице долей.

Makovec

8.02.2012 - 01:09

Ух ты! Спасибо огромное! Теперь бы научиться все это делать самой

. Немного знакома со Stat Plus, везде все по-разному ! А когда эти же методы по отношению к женщинам-мужчинам / молодым - старым сравнивать, принцип должен поменяться? И на Реброву ссылочку не дадите?

DrgLena

8.02.2012 - 01:22

Принцип не поменяется, все можно посчитать руками, нужно только правильно составить таблицу 2х2, есть и калькуляторы в сети.
Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA
НАЙДЕТЕ В СЕТИ

DrgLena

8.02.2012 - 19:05

Поймете принцип, сможете сделать и руками и в любой программе, можно и в R, для УЗИ:
> data<-array(c(51,8,0,14),dim=c(2,2))
> mcnemar.test(data)
McNemar's Chi-squared test with continuity correction
data: data
McNemar's chi-squared = 6.125, df = 1, p-value = 0.01333

DoctorStat

8.02.2012 - 19:30

Цитата(Makovec @ 8.02.2012 - 02:09)

на Реброву ссылочку не дадите?

Реброва О.Ю.
Статистический анализ медицинских данных

Makovec

9.02.2012 - 06:49

Спасибо всем большое, придется продолжить в выходные. К сожалению, в тех программах которые уже успела установить (NCSS Pass и АtteStat), никак не могу добиться таких же показателей хи-квадрат и p, как у вас. В АtteStat совпадают вычисленные показатели чувствительности и специфичности (отсюда догадываюсь, что таблицу 2x2 построила правильно), но все остальное выглядит странно (для ТАБ):
Критерий Мак-Немара
Асимптотика хи-квадрат
Статистика, P-значение (одностороннее), P-значение (двустороннее)
2 0.078649604 0.157299207
Асимптотика с поправкой Йэйтса
Статистика, P-значение (одностороннее), P-значение (двустороннее)
1.125 0.144422183 0.288844366
Точный условный
Статистика, P-значение (одностороннее), P-значение (двустороннее)
2 0.08984375 0.1796875
Значит, делаю что-то не то. А что такое R, какая-то программа?
DoctorStat, большое спасибо за Реброву, в воскресенье надеюсь продвинуться. Сказывается отсутствие базовых знаний по статистике

.

DrgLena

9.02.2012 - 22:09

Цитата(Makovec @ 9.02.2012 - 06:49)

В АtteStat совпадают вычисленные показатели чувствительности и специфичности (отсюда догадываюсь, что таблицу 2x2 построила правильно),

Вы построили таблицу сопряженности 2х2, а нужно составить ее следующим образом, как я показала в R (свободная программа)
a=++
b=+-
c=-+
d=--
(51, 8, 0, 14) при такой записи интересует диагональ bc.

Makovec

12.02.2012 - 13:35

Простите, я не могу разобраться, откуда в скобках взялись 0 и 14? Подходящие разделы Ребровой внимательно прочитала - не нахожу похожих формул. программу R нашла, установила и даже такую же p для УЗИ (с вашим маленьким кодом, DrgLena) получила. Подскажите пожалуйста, как правильно начать в моем случае. Мне много чего надо еще пересчитывать! Надеюсь, что с вашей помощью сумею разобраться. Очень благодарна за ответы и терпение.

p2004r

12.02.2012 - 15:17

Цитата(Makovec @ 12.02.2012 - 13:35)

Простите, я не могу разобраться, откуда в скобках взялись 0 и 14? Подходящие разделы Ребровой внимательно прочитала - не нахожу похожих формул. программу R нашла, установила и даже такую же p для УЗИ (с вашим маленьким кодом, DrgLena) получила. Подскажите пожалуйста, как правильно начать в моем случае. Мне много чего надо еще пересчитывать! Надеюсь, что с вашей помощью сумею разобраться. Очень благодарна за ответы и терпение.

В помощи ?mcnemar.test вот такой пример данных

Код

> matrix(c(794, 86, 150, 570),
+             nrow = 2,
+             dimnames = list("1st Survey" = c("Approve", "Disapprove"),
+                             "2nd Survey" = c("Approve", "Disapprove")))
            2nd Survey
1st Survey   Approve Disapprove
  Approve        794        150
  Disapprove      86        570

DrgLena

12.02.2012 - 16:06

Да, Реброва формулу не приводит, но описывает, как таблицу составить (стр 181). Я в своих рассуждениях учитывала только тот факт, что 59-51=8 и это b, а нуль я поставила в ячейку с. Тогда и разнисть и сумма диагонали будет 8. Это было бы верно,если второй тест дал бы 51 положительных и 14 отрицательных ответов, и ни у кого из тех, у кого по золотому стандарту было добро не было зла. Т.е. не учитывала ложно отрицительных и ложно положительных во втором тесте. Любой пример руками легко считается, формула есть в инете,нужна только разность и сумма диагонали bc.

DrgLena

12.02.2012 - 16:09

Chi2: 16.818 (p= 0.000)

Makovec

12.02.2012 - 16:31

И ище: мне надо сравнить эффективность выявления рака каждым из диагностических методов отдельно для женщин и мужчин / старше / младше 45 лет. Если чувствительность методов, например, мы сравниваем попарно с 'золотым стандартом', то как поступить в случае сравнения между такими подгруппами?

DrgLena

12.02.2012 - 16:48

Вот и сравнивайте чувствительности относительно 51 (100%) как разности долей с соответствующими ДИ, для разности, как описывает Реброва на той же странице. А специфичности - аналогично, относительно 14 (100%) Сравнение ДИ , особенно графически даст картину различий. Все подгруппы будут сделаны из этого числа больных.

Makovec

12.02.2012 - 16:59

Спасибо, попробую. А для получения уровня значимости р для специфичности УЗИ, например, мне надо ввести: data<-array(c(8,6,0,0),dim=c(2,2))?

DrgLena

12.02.2012 - 17:41

Нет, не верно. Сумма маргинальных частот должна быть 73. Я сама слишком много предложила и вам трудно сделать выбор. Можно сделать сравнение по М-Н, а можно сравнением долей посредством ДИ. Составляйте табл так как у Ребровой, при этом вы сможете сравнить разность относительных частот посредством ДИ, и по тем же таблицам посчитать критерий. Но Реброва дает М-Н так, как если бы данные у вас были в виде базы данных, когда результаты тестов представлены в виде бинарных переменных (1 ,0). При этом вы можете задавать любые условия создания выборок для анализа. Создавая таблицы вручную легко ошибиться.

Larina Tatjana

5.03.2012 - 19:53

Цитата(Makovec @ 8.02.2012 - 03:41)

Спасибо. как же с этим разобраться?

А другого способа, через уровень значимости, никакого нет?

Привет, Makovec!

А почему Вас пугает уровень значимости? Во-первых, если речь идёт о сравнении параметров диагностических методов, то тут не обойтись без ROC-кривых. Но это возможно конечно лишь для 2-х вариантов исхода диагностического тестирования. Во-вторых, в этом случае специфичность и чувствительность взаимосвязаны между собой, и отрывать один параметр от друга неверно. Вывод: нужно сравнивать ROC-кривые. Такие варианты сравнения есть. В них сравнивают площади под кривой. Чем ближе площадь к 1, тем лучше. И для этого сравнения вычисляется уровень значимости. Т.е. возможны варианты, когда между разными кривыми нет значимого различия. Правда здесь есть один нюанс. Нужно научиться "втискивать" в диагностический показатель целый набор признаков, качественных и количественных. А это достигается разными методами.