Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Определение чувствительности и специфичности комбинации маркеров
Zaycho
сообщение 2.08.2012 - 14:20
Сообщение #1





Группа: Пользователи
Сообщений: 10
Регистрация: 2.08.2012
Пользователь №: 24035



Здравствуйте!

Есть задача определить диагностическую ценность ряда маркеров (допустим, А, В и С) и их комбинаций в диагностике некоторого заболевания.
Я расчитал все параметры (чувствительность, специфичность, PPV, NPV, LR) и построил в SPSS ROC-кривые отдельно для А, В и С.
Как теперь сделать то же самое для комбинаций этих маркеров, допустим, А+В и В+С? Где копать?

Заранее огромное спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
p2004r
сообщение 2.08.2012 - 14:24
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Zaycho @ 2.08.2012 - 14:20) *
Здравствуйте!

Есть задача определить диагностическую ценность ряда маркеров (допустим, А, В и С) и их комбинаций в диагностике некоторого заболевания.
Я расчитал все параметры (чувствительность, специфичность, PPV, NPV, LR) и построил в SPSS ROC-кривые отдельно для А, В и С.
Как теперь сделать то же самое для комбинаций этих маркеров, допустим, А+В и В+С? Где копать?

Заранее огромное спасибо!


можно рандомфорест применить и вклад маркеров по его результатам определить. можно логистическую регрессию для полной модели построить и для комбинаций. модели сравнивать через сравнение ROC.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Zaycho
сообщение 2.08.2012 - 14:37
Сообщение #3





Группа: Пользователи
Сообщений: 10
Регистрация: 2.08.2012
Пользователь №: 24035



Цитата(p2004r @ 2.08.2012 - 15:24) *
можно рандомфорест применить и вклад маркеров по его результатам определить. можно логистическую регрессию для полной модели построить и для комбинаций. модели сравнивать через сравнение ROC.


Big thx за ответ, но я не такой великий спец в статистике - если не затруднит, можно чуть подробнее? Как построить логистическую регрессию для полной модели (как сгруппировать исходные данные?) В идеале - где это все в SPSS и/или Статистике? Ну а если с примером........ smile.gif))

Сообщение отредактировал Zaycho - 2.08.2012 - 14:40
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 2.08.2012 - 19:38
Сообщение #4





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Zaycho @ 2.08.2012 - 14:37) *
Big thx за ответ, но я не такой великий спец в статистике - если не затруднит, можно чуть подробнее? Как построить логистическую регрессию для полной модели (как сгруппировать исходные данные?) В идеале - где это все в SPSS и/или Статистике? Ну а если с примером........ smile.gif))


могу в R показать smile.gif, но для полного примера нужны данные smile.gif)

как понимаю есть эксперимент или наблюдение в котором каждому случаю наличия-отсутствия заболевания соответствует строка наличия-отсутствия признаков? если случаи наблюдения-эксперимента не представляют сочетания наличия-отсутствия признаков то естественно ничего хорошего скорее всего не получится.

на такую таблицу (назовем её table) легко натравить randomForest

Код
rf <- randomForest(Болезнь ~ ., data=table,
                             importance=TRUE,
                             proximity=TRUE)


После этого смотрим вклад признаков

Код
varImpPlot(rf)




Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Zaycho
сообщение 2.08.2012 - 21:55
Сообщение #5





Группа: Пользователи
Сообщений: 10
Регистрация: 2.08.2012
Пользователь №: 24035



А можно я все-таки покажу исходные данные?
А, В и С - непрерывные величины
Выжил/умер - принимает только 2 значения smile.gif)
Прикрепленные файлы
Прикрепленный файл  Исходник.zip ( 15,51 килобайт ) Кол-во скачиваний: 381
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 3.08.2012 - 12:04
Сообщение #6





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Zaycho @ 2.08.2012 - 21:55) *
А можно я все-таки покажу исходные данные?
А, В и С - непрерывные величины
Выжил/умер - принимает только 2 значения smile.gif)


таблицу чуток пришлось отредактировать от пояснений

Код
rf<-randomForest(data.na[,2:4],factor(data.na$выжил.умер), proximity=TRUE)

> rf

Call:
randomForest(x = data.na[, 2:4], y = factor(data.na$выжил.умер),      proximity = TRUE)
               Type of random forest: classification
                     Number of trees: 500
No. of variables tried at each split: 1

        OOB estimate of  error rate: 31.43%
Confusion matrix:
   0  1 class.error
0 22 11   0.3333333
1 11 26   0.2972973


> round(importance(rf), 2)
  MeanDecreaseGini
A            10.93
B            12.09
C            10.97

> MDSplot(rf, factor(data.na$выжил.умер), k=2, palette=c(1, 2), pch=data.na$выжил.умер)


собственно все случаи делятся явно на две группы, и имеются два фактора "выживания". первый фактор действует в обоих группах. второй фактор собственно определяет деление на две группы в одной из которых смертность намного ниже чем во второй группе (и обусловлена действием первого фактора).

Эскизы прикрепленных изображений
Прикрепленное изображение
 


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Zaycho
сообщение 3.08.2012 - 14:27
Сообщение #7





Группа: Пользователи
Сообщений: 10
Регистрация: 2.08.2012
Пользователь №: 24035



Огромное спасибо за разъяснения! А можете теперь ткнуть пальцем ламеру, где здесь групповые вероятности, которые можно подставить в ROC-анализ?


Прикрепленные файлы
Прикрепленный файл  Результат.zip ( 12,6 килобайт ) Кол-во скачиваний: 341
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 3.08.2012 - 14:59
Сообщение #8





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Zaycho @ 3.08.2012 - 14:27) *
Огромное спасибо за разъяснения! А можете теперь ткнуть пальцем ламеру, где здесь групповые вероятности, которые можно подставить в ROC-анализ?


для первого датасета

Код
> data.frame(votes=rf$votes, alive=data.na$выжил.умер, n=data.na$N )
      votes.0    votes.1 alive  n
1  0.76243094 0.23756906     0  1
2  0.80203046 0.19796954     1  2
3  0.72067039 0.27932961     0  3
4  0.17486339 0.82513661     0  4
5  0.74054054 0.25945946     0  5
6  0.82352941 0.17647059     1  6
7  0.37055838 0.62944162     1  7
8  0.80213904 0.19786096     1  8
9  0.27472527 0.72527473     1  9
10 0.70322581 0.29677419     0 10
11 0.60215054 0.39784946     0 11
12 0.39512195 0.60487805     1 12
13 0.83815029 0.16184971     0 13
14 0.89893617 0.10106383     0 14
15 0.40101523 0.59898477     0 15
16 0.79081633 0.20918367     0 16
17 0.68333333 0.31666667     0 17
18 0.67875648 0.32124352     0 18
19 0.75126904 0.24873096     0 19
20 0.91847826 0.08152174     1 20
21 0.61931818 0.38068182     1 21
22 0.35955056 0.64044944     1 22
23 0.95480226 0.04519774     0 23
24 0.61271676 0.38728324     0 24
25 0.84574468 0.15425532     0 25
26 0.91256831 0.08743169     0 26
27 0.43930636 0.56069364     1 27
28 0.22857143 0.77142857     1 28
29 0.15346535 0.84653465     1 29
31 0.12626263 0.87373737     0 31
33 0.29444444 0.70555556     0 33
34 0.28571429 0.71428571     1 34
35 0.07692308 0.92307692     1 35
36 0.04216867 0.95783133     1 36
37 0.59259259 0.40740741     1 37
38 0.63725490 0.36274510     1 38
39 0.38596491 0.61403509     1 39
40 0.41340782 0.58659218     0 40
41 0.08074534 0.91925466     1 41
42 0.39779006 0.60220994     0 42
43 0.31428571 0.68571429     1 43
44 0.16666667 0.83333333     1 44
45 0.38636364 0.61363636     0 45
46 0.24043716 0.75956284     0 46
47 0.66883117 0.33116883     0 47
48 0.69540230 0.30459770     0 48
49 0.60679612 0.39320388     0 49
50 0.45180723 0.54819277     1 50
51 0.08152174 0.91847826     1 51
52 0.09696970 0.90303030     1 52
53 0.20329670 0.79670330     0 53
54 0.30898876 0.69101124     1 54
55 0.63783784 0.36216216     1 55
56 0.58285714 0.41714286     0 56
57 0.09826590 0.90173410     1 57
58 0.08045977 0.91954023     1 58
59 0.07608696 0.92391304     1 59
60 0.30508475 0.69491525     0 60
61 0.40000000 0.60000000     1 61
62 0.28342246 0.71657754     1 62
63 0.63068182 0.36931818     1 63
64 0.58252427 0.41747573     1 64
65 0.87730061 0.12269939     1 65
66 0.08982036 0.91017964     1 66
67 0.36898396 0.63101604     1 67
68 0.72881356 0.27118644     0 68
69 0.71022727 0.28977273     0 69
70 0.74033149 0.25966851     0 70
71 0.37158470 0.62841530     1 71
72 0.47849462 0.52150538     0 72


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Zaycho   Определение чувствительности и специфичности комбинации маркеров   2.08.2012 - 14:20
- - p2004r   Цитата(Zaycho @ 2.08.2012 - 14:20) З...   2.08.2012 - 14:24
|- - Zaycho   Цитата(p2004r @ 2.08.2012 - 15:24) м...   2.08.2012 - 14:37
|- - p2004r   Цитата(Zaycho @ 2.08.2012 - 14:37) B...   2.08.2012 - 19:38
|- - Zaycho   А можно я все-таки покажу исходные данные? А, В и ...   2.08.2012 - 21:55
|- - p2004r   Цитата(Zaycho @ 2.08.2012 - 21:55) А...   3.08.2012 - 12:04
|- - Zaycho   Огромное спасибо за разъяснения! А можете тепе...   3.08.2012 - 14:27
|- - p2004r   Цитата(Zaycho @ 3.08.2012 - 14:27) О...   3.08.2012 - 14:59
|- - Zaycho   Глубокоуважаемый p2004r, правильно ли я понял, что...   3.08.2012 - 16:05
|- - p2004r   Цитата(Zaycho @ 3.08.2012 - 16:05) Г...   3.08.2012 - 16:30
|- - Zaycho   Я вконец запутался. А,В и С - это параметры, не вл...   3.08.2012 - 16:38
|- - p2004r   Цитата(Zaycho @ 3.08.2012 - 16:38) Я...   3.08.2012 - 19:29
- - TheThing   Цитата(Zaycho @ 2.08.2012 - 14:20) З...   3.08.2012 - 08:55
- - TheThing   Согласно моим расчетам лишь фактор С (тяжесть сост...   3.08.2012 - 20:07
|- - p2004r   Цитата(TheThing @ 3.08.2012 - 20:07)...   3.08.2012 - 21:12
- - TheThing   значит логистическая регрессия и рэндом форест даю...   3.08.2012 - 21:22
|- - p2004r   Цитата(TheThing @ 3.08.2012 - 21:22)...   3.08.2012 - 21:48
- - DrgLena   А если не лес строить, а одно дерево, то при одном...   3.08.2012 - 23:56
|- - p2004r   Цитата(DrgLena @ 3.08.2012 - 23:56) ...   4.08.2012 - 10:42
|- - p2004r   собственно да, svm получше выделяет Код> mode...   4.08.2012 - 11:18
|- - p2004r   линеаризирующее преобразование (!после отрезан...   4.08.2012 - 11:41
|- - Zaycho   Коллеги, а если вернуться к посту #14, то как опре...   5.08.2012 - 11:23
|- - p2004r   Цитата(Zaycho @ 5.08.2012 - 11:23) К...   5.08.2012 - 12:55
- - Zaycho   Да, я и не предполагал, что задача окажется не так...   4.08.2012 - 09:39
- - TheThing   Решил сделать рэндом форест, а также построить про...   5.08.2012 - 15:37
|- - p2004r   и все таки, после применения правила С>25, оста...   5.08.2012 - 15:56
|- - TheThing   Кстати, вот хорошая статья, где проводился сравнит...   5.08.2012 - 16:40
|- - p2004r   Цитата(TheThing @ 5.08.2012 - 16:40)...   5.08.2012 - 19:05
- - Диана   Раз зашла речь про ROC-анализ в программе SPSS под...   16.08.2012 - 09:25
|- - TheThing   Цитата(Диана @ 16.08.2012 - 09:25) Р...   16.08.2012 - 15:38
|- - Диана   Цитата(TheThing @ 16.08.2012 - 16:38...   16.08.2012 - 20:10
|- - p2004r   Цитата(Диана @ 16.08.2012 - 20:10) С...   16.08.2012 - 21:53
|- - TheThing   Цитата(Диана @ 16.08.2012 - 20:10) С...   16.08.2012 - 22:34
- - Диана   КФР-контролируемый фактор риска, НФР-неконтролируе...   17.08.2012 - 09:02
|- - p2004r   Цитата(Диана @ 17.08.2012 - 09:02) К...   17.08.2012 - 15:28
- - Диана   я немножко сократила таблицу, убрала малоинтересую...   17.08.2012 - 18:05
|- - p2004r   Цитата(Диана @ 17.08.2012 - 18:05) я...   17.08.2012 - 22:26
- - Диана   Факторы риска: 2 3 5 ...   18.08.2012 - 08:58
|- - p2004r   Цитата(Диана @ 18.08.2012 - 08:58) Ф...   18.08.2012 - 13:18
- - Диана   спасибо за помощь. колонки 44-46 не имеют влияние...   18.08.2012 - 20:57
|- - p2004r   Цитата(Диана @ 18.08.2012 - 20:57) с...   18.08.2012 - 22:37
- - Диана   колонки 44А 45А 46А были перекодированные колонки ...   19.08.2012 - 09:21
- - Диана   Подскажите кто знает: возможно ли удалить выложенн...   26.08.2012 - 08:57
- - Диана   ничего не получается, от проводимого лечения нет д...   26.08.2012 - 08:59
|- - p2004r   Цитата(Диана @ 26.08.2012 - 08:59) н...   27.08.2012 - 15:12
|- - Диана   Цитата(p2004r @ 27.08.2012 - 16:12) ...   27.08.2012 - 16:58
|- - p2004r   Цитата(Диана @ 27.08.2012 - 16:58) з...   27.08.2012 - 17:14
|- - Диана   2) "влияет ли тип операции на снижение частот...   27.08.2012 - 17:42
- - Диана   Хорошо, 13 колонка делит пациентов на 3 группы. Ле...   27.08.2012 - 17:25
- - Диана   1) влияет ли снижение ЧСС до операции на снижение ...   27.08.2012 - 17:29
|- - p2004r   Цитата(Диана @ 27.08.2012 - 17:29) 1...   27.08.2012 - 22:24
- - Диана   супер, в мозаичных графиках данные очень наглядно ...   28.08.2012 - 09:02
|- - p2004r   Цитата(Диана @ 28.08.2012 - 09:02) с...   28.08.2012 - 12:07
- - Диана   у меня есть данные факторного анализа, но, как сей...   28.08.2012 - 13:46
|- - p2004r   Цитата(Диана @ 28.08.2012 - 13:46) у...   28.08.2012 - 19:54
- - Диана   RE: Определение чувствительности и специфичности комбинации маркеров   28.08.2012 - 21:10
|- - p2004r   Цитата(Диана @ 28.08.2012 - 21:10) ...   31.08.2012 - 16:49
|- - Диана   фактически группы две - 1 и 3, вторая размазана ме...   1.09.2012 - 22:22
- - Диана   не могу разобраться с 3 графиком, какой то он слож...   1.09.2012 - 22:26
|- - p2004r   Цитата(Диана @ 1.09.2012 - 22:26) н...   3.09.2012 - 18:18
- - p2004r   Для новых данных надо заново номера переменных соб...   7.09.2012 - 20:00
|- - p2004r   Цитата(p2004r @ 7.09.2012 - 20:00) Д...   10.09.2012 - 11:33
- - Диана   ГБ : int 3 3 3 3 3 3 3 3 3 3 ....   10.09.2012 - 21:47


Добавить ответ в эту темуОткрыть тему