Здравствуйте, гость ( Вход | Регистрация )
2.08.2012 - 14:20
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 2.08.2012 Пользователь №: 24035 |
Здравствуйте!
Есть задача определить диагностическую ценность ряда маркеров (допустим, А, В и С) и их комбинаций в диагностике некоторого заболевания. Я расчитал все параметры (чувствительность, специфичность, PPV, NPV, LR) и построил в SPSS ROC-кривые отдельно для А, В и С. Как теперь сделать то же самое для комбинаций этих маркеров, допустим, А+В и В+С? Где копать? Заранее огромное спасибо! |
|
|
![]() |
![]() |
![]() |
2.08.2012 - 14:24
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Здравствуйте! Есть задача определить диагностическую ценность ряда маркеров (допустим, А, В и С) и их комбинаций в диагностике некоторого заболевания. Я расчитал все параметры (чувствительность, специфичность, PPV, NPV, LR) и построил в SPSS ROC-кривые отдельно для А, В и С. Как теперь сделать то же самое для комбинаций этих маркеров, допустим, А+В и В+С? Где копать? Заранее огромное спасибо! можно рандомфорест применить и вклад маркеров по его результатам определить. можно логистическую регрессию для полной модели построить и для комбинаций. модели сравнивать через сравнение ROC. ![]() |
|
|
![]() |
![]() |
2.08.2012 - 14:37
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 2.08.2012 Пользователь №: 24035 |
можно рандомфорест применить и вклад маркеров по его результатам определить. можно логистическую регрессию для полной модели построить и для комбинаций. модели сравнивать через сравнение ROC. Big thx за ответ, но я не такой великий спец в статистике - если не затруднит, можно чуть подробнее? Как построить логистическую регрессию для полной модели (как сгруппировать исходные данные?) В идеале - где это все в SPSS и/или Статистике? Ну а если с примером........ Сообщение отредактировал Zaycho - 2.08.2012 - 14:40 |
|
|
![]() |
![]() |
2.08.2012 - 19:38
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Big thx за ответ, но я не такой великий спец в статистике - если не затруднит, можно чуть подробнее? Как построить логистическую регрессию для полной модели (как сгруппировать исходные данные?) В идеале - где это все в SPSS и/или Статистике? Ну а если с примером........ могу в R показать как понимаю есть эксперимент или наблюдение в котором каждому случаю наличия-отсутствия заболевания соответствует строка наличия-отсутствия признаков? если случаи наблюдения-эксперимента не представляют сочетания наличия-отсутствия признаков то естественно ничего хорошего скорее всего не получится. на такую таблицу (назовем её table) легко натравить randomForest Код rf <- randomForest(Болезнь ~ ., data=table, importance=TRUE, proximity=TRUE) После этого смотрим вклад признаков Код varImpPlot(rf) ![]() |
|
|
![]() |
![]() |
2.08.2012 - 21:55
Сообщение
#5
|
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 2.08.2012 Пользователь №: 24035 |
А можно я все-таки покажу исходные данные?
А, В и С - непрерывные величины Выжил/умер - принимает только 2 значения
Прикрепленные файлы
|
|
|
![]() |
![]() |
3.08.2012 - 12:04
Сообщение
#6
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
А можно я все-таки покажу исходные данные? А, В и С - непрерывные величины Выжил/умер - принимает только 2 значения таблицу чуток пришлось отредактировать от пояснений Код rf<-randomForest(data.na[,2:4],factor(data.na$выжил.умер), proximity=TRUE) > rf Call: randomForest(x = data.na[, 2:4], y = factor(data.na$выжил.умер), proximity = TRUE) Type of random forest: classification Number of trees: 500 No. of variables tried at each split: 1 OOB estimate of error rate: 31.43% Confusion matrix: 0 1 class.error 0 22 11 0.3333333 1 11 26 0.2972973 > round(importance(rf), 2) MeanDecreaseGini A 10.93 B 12.09 C 10.97 > MDSplot(rf, factor(data.na$выжил.умер), k=2, palette=c(1, 2), pch=data.na$выжил.умер) собственно все случаи делятся явно на две группы, и имеются два фактора "выживания". первый фактор действует в обоих группах. второй фактор собственно определяет деление на две группы в одной из которых смертность намного ниже чем во второй группе (и обусловлена действием первого фактора). ![]() |
|
|
![]() |
![]() |
3.08.2012 - 14:27
Сообщение
#7
|
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 2.08.2012 Пользователь №: 24035 |
Огромное спасибо за разъяснения! А можете теперь ткнуть пальцем ламеру, где здесь групповые вероятности, которые можно подставить в ROC-анализ?
Прикрепленные файлы
|
|
|
![]() |
![]() |
3.08.2012 - 14:59
Сообщение
#8
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Огромное спасибо за разъяснения! А можете теперь ткнуть пальцем ламеру, где здесь групповые вероятности, которые можно подставить в ROC-анализ? для первого датасета Код > data.frame(votes=rf$votes, alive=data.na$выжил.умер, n=data.na$N )
votes.0 votes.1 alive n 1 0.76243094 0.23756906 0 1 2 0.80203046 0.19796954 1 2 3 0.72067039 0.27932961 0 3 4 0.17486339 0.82513661 0 4 5 0.74054054 0.25945946 0 5 6 0.82352941 0.17647059 1 6 7 0.37055838 0.62944162 1 7 8 0.80213904 0.19786096 1 8 9 0.27472527 0.72527473 1 9 10 0.70322581 0.29677419 0 10 11 0.60215054 0.39784946 0 11 12 0.39512195 0.60487805 1 12 13 0.83815029 0.16184971 0 13 14 0.89893617 0.10106383 0 14 15 0.40101523 0.59898477 0 15 16 0.79081633 0.20918367 0 16 17 0.68333333 0.31666667 0 17 18 0.67875648 0.32124352 0 18 19 0.75126904 0.24873096 0 19 20 0.91847826 0.08152174 1 20 21 0.61931818 0.38068182 1 21 22 0.35955056 0.64044944 1 22 23 0.95480226 0.04519774 0 23 24 0.61271676 0.38728324 0 24 25 0.84574468 0.15425532 0 25 26 0.91256831 0.08743169 0 26 27 0.43930636 0.56069364 1 27 28 0.22857143 0.77142857 1 28 29 0.15346535 0.84653465 1 29 31 0.12626263 0.87373737 0 31 33 0.29444444 0.70555556 0 33 34 0.28571429 0.71428571 1 34 35 0.07692308 0.92307692 1 35 36 0.04216867 0.95783133 1 36 37 0.59259259 0.40740741 1 37 38 0.63725490 0.36274510 1 38 39 0.38596491 0.61403509 1 39 40 0.41340782 0.58659218 0 40 41 0.08074534 0.91925466 1 41 42 0.39779006 0.60220994 0 42 43 0.31428571 0.68571429 1 43 44 0.16666667 0.83333333 1 44 45 0.38636364 0.61363636 0 45 46 0.24043716 0.75956284 0 46 47 0.66883117 0.33116883 0 47 48 0.69540230 0.30459770 0 48 49 0.60679612 0.39320388 0 49 50 0.45180723 0.54819277 1 50 51 0.08152174 0.91847826 1 51 52 0.09696970 0.90303030 1 52 53 0.20329670 0.79670330 0 53 54 0.30898876 0.69101124 1 54 55 0.63783784 0.36216216 1 55 56 0.58285714 0.41714286 0 56 57 0.09826590 0.90173410 1 57 58 0.08045977 0.91954023 1 58 59 0.07608696 0.92391304 1 59 60 0.30508475 0.69491525 0 60 61 0.40000000 0.60000000 1 61 62 0.28342246 0.71657754 1 62 63 0.63068182 0.36931818 1 63 64 0.58252427 0.41747573 1 64 65 0.87730061 0.12269939 1 65 66 0.08982036 0.91017964 1 66 67 0.36898396 0.63101604 1 67 68 0.72881356 0.27118644 0 68 69 0.71022727 0.28977273 0 69 70 0.74033149 0.25966851 0 70 71 0.37158470 0.62841530 1 71 72 0.47849462 0.52150538 0 72 ![]() |
|
|
![]() |
![]() |
Zaycho Определение чувствительности и специфичности комбинации маркеров 2.08.2012 - 14:20
Zaycho Глубокоуважаемый p2004r, правильно ли я понял, что... 3.08.2012 - 16:05
p2004r Цитата(Zaycho @ 3.08.2012 - 16:05) Г... 3.08.2012 - 16:30
Zaycho Я вконец запутался. А,В и С - это параметры, не вл... 3.08.2012 - 16:38
p2004r Цитата(Zaycho @ 3.08.2012 - 16:38) Я... 3.08.2012 - 19:29
TheThing Цитата(Zaycho @ 2.08.2012 - 14:20) З... 3.08.2012 - 08:55
TheThing Согласно моим расчетам лишь фактор С (тяжесть сост... 3.08.2012 - 20:07
p2004r Цитата(TheThing @ 3.08.2012 - 20:07)... 3.08.2012 - 21:12
TheThing значит логистическая регрессия и рэндом форест даю... 3.08.2012 - 21:22
p2004r Цитата(TheThing @ 3.08.2012 - 21:22)... 3.08.2012 - 21:48
DrgLena А если не лес строить, а одно дерево, то при одном... 3.08.2012 - 23:56
p2004r Цитата(DrgLena @ 3.08.2012 - 23:56) ... 4.08.2012 - 10:42
p2004r собственно да, svm получше выделяет
Код> mode... 4.08.2012 - 11:18
p2004r линеаризирующее преобразование (!после отрезан... 4.08.2012 - 11:41
Zaycho Коллеги, а если вернуться к посту #14, то как опре... 5.08.2012 - 11:23
p2004r Цитата(Zaycho @ 5.08.2012 - 11:23) К... 5.08.2012 - 12:55
Zaycho Да, я и не предполагал, что задача окажется не так... 4.08.2012 - 09:39
TheThing Решил сделать рэндом форест, а также построить про... 5.08.2012 - 15:37
p2004r и все таки, после применения правила С>25, оста... 5.08.2012 - 15:56
TheThing Кстати, вот хорошая статья, где проводился сравнит... 5.08.2012 - 16:40
p2004r Цитата(TheThing @ 5.08.2012 - 16:40)... 5.08.2012 - 19:05
Диана Раз зашла речь про ROC-анализ в программе SPSS под... 16.08.2012 - 09:25
TheThing Цитата(Диана @ 16.08.2012 - 09:25) Р... 16.08.2012 - 15:38
Диана Цитата(TheThing @ 16.08.2012 - 16:38... 16.08.2012 - 20:10
p2004r Цитата(Диана @ 16.08.2012 - 20:10) С... 16.08.2012 - 21:53
TheThing Цитата(Диана @ 16.08.2012 - 20:10) С... 16.08.2012 - 22:34
Диана КФР-контролируемый фактор риска, НФР-неконтролируе... 17.08.2012 - 09:02
p2004r Цитата(Диана @ 17.08.2012 - 09:02) К... 17.08.2012 - 15:28
Диана я немножко сократила таблицу, убрала малоинтересую... 17.08.2012 - 18:05
p2004r Цитата(Диана @ 17.08.2012 - 18:05) я... 17.08.2012 - 22:26
Диана Факторы риска:
2
3
5 ... 18.08.2012 - 08:58
p2004r Цитата(Диана @ 18.08.2012 - 08:58) Ф... 18.08.2012 - 13:18
Диана спасибо за помощь. колонки 44-46 не имеют влияние... 18.08.2012 - 20:57
p2004r Цитата(Диана @ 18.08.2012 - 20:57) с... 18.08.2012 - 22:37
Диана колонки 44А 45А 46А были перекодированные колонки ... 19.08.2012 - 09:21
Диана Подскажите кто знает: возможно ли удалить выложенн... 26.08.2012 - 08:57
Диана ничего не получается, от проводимого лечения нет д... 26.08.2012 - 08:59
p2004r Цитата(Диана @ 26.08.2012 - 08:59) н... 27.08.2012 - 15:12
Диана Цитата(p2004r @ 27.08.2012 - 16:12) ... 27.08.2012 - 16:58
p2004r Цитата(Диана @ 27.08.2012 - 16:58) з... 27.08.2012 - 17:14
Диана 2) "влияет ли тип операции на снижение частот... 27.08.2012 - 17:42
Диана Хорошо, 13 колонка делит пациентов на 3 группы. Ле... 27.08.2012 - 17:25
Диана 1) влияет ли снижение ЧСС до операции на снижение ... 27.08.2012 - 17:29
p2004r Цитата(Диана @ 27.08.2012 - 17:29) 1... 27.08.2012 - 22:24
Диана супер, в мозаичных графиках данные очень наглядно ... 28.08.2012 - 09:02
p2004r Цитата(Диана @ 28.08.2012 - 09:02) с... 28.08.2012 - 12:07
Диана у меня есть данные факторного анализа, но, как сей... 28.08.2012 - 13:46
p2004r Цитата(Диана @ 28.08.2012 - 13:46) у... 28.08.2012 - 19:54
Диана RE: Определение чувствительности и специфичности комбинации маркеров 28.08.2012 - 21:10
p2004r Цитата(Диана @ 28.08.2012 - 21:10)
... 31.08.2012 - 16:49
Диана фактически группы две - 1 и 3, вторая размазана ме... 1.09.2012 - 22:22
Диана не могу разобраться с 3 графиком, какой то он слож... 1.09.2012 - 22:26
p2004r Цитата(Диана @ 1.09.2012 - 22:26) н... 3.09.2012 - 18:18
p2004r Для новых данных надо заново номера переменных соб... 7.09.2012 - 20:00
p2004r Цитата(p2004r @ 7.09.2012 - 20:00) Д... 10.09.2012 - 11:33
Диана ГБ : int 3 3 3 3 3 3 3 3 3 3 .... 10.09.2012 - 21:47![]() ![]() |