Здравствуйте, гость ( Вход | Регистрация )
2.08.2012 - 14:20
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 2.08.2012 Пользователь №: 24035 |
Здравствуйте!
Есть задача определить диагностическую ценность ряда маркеров (допустим, А, В и С) и их комбинаций в диагностике некоторого заболевания. Я расчитал все параметры (чувствительность, специфичность, PPV, NPV, LR) и построил в SPSS ROC-кривые отдельно для А, В и С. Как теперь сделать то же самое для комбинаций этих маркеров, допустим, А+В и В+С? Где копать? Заранее огромное спасибо! |
|
|
![]() |
![]() |
![]() |
17.08.2012 - 09:02
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 39 Регистрация: 30.06.2012 Пользователь №: 23898 |
КФР-контролируемый фактор риска, НФР-неконтролируемый ФР, ЗАДАЧА- выявить наиболее вероятные факторы риска для прогнозирования развития кардиальных осложнений в послеоперационном периоде
Сообщение отредактировал Диана - 31.08.2012 - 09:46 |
|
|
![]() |
![]() |
17.08.2012 - 15:28
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
КФР-контролируемый фактор риска, НФР-неконтролируемый ФР, ЗАДАЧА- выявить наиболее вероятные факторы риска для прогнозирования развития кардиальных осложнений в послеоперационном периоде много пропущенных данных... будет интересно у меня после импорта данных (там иногда попадаются точки в ячейках, нельзя ли сохранить таблицу с простым заголовком в старом эксель формате? а то я не уверен в корректности импорта) получились вот такие переменные: Код > names(read.csv2("mp3gl.csv")) [1] "ФИО.шифр" "пол" [3] "возраст" "ИМТ..кг.м2" [5] "ИМТ" "S.тела.по.Дюб" [7] "к.во.дней.до.опер" "к.во.дней.после.опер" [9] "время.уст..я.д.за.анев" "кардио.жалобы" [11] "длит.кардиожалоб" "хирург.жалобы" [13] "группы.по.лечению" "п.о.кард.осложн" [15] "Кард.осл.я" "летальность" [17] "стресс.ЭхоКГ" "к.во.зон.гипо.и.акинезии" [19] "X" "X.1" [21] "ГБ" "X.2" [23] "ГБ.ГЛЖ" "ИБС..стенокардия" [25] "постинф.кардиоскл" "НК..фк" [27] "ДЛП" "размер.АБА" [29] "синдромность" "прех.ишем.послеопер" [31] "СД" "доступ" [33] "курение" "диаст..Дисфункция00" [35] "САД1" "ДАД1" [37] "ЧСС1" "САД5" [39] "ДАД5" "ЧСС5" [41] "САД.д.о" "ДАД.д.о" [43] "ЧСС.д.о" "САД.п.о" [45] "ДАД.п.о" "ЧСС.п.о" [47] "бета.блокеры" "ББдоза" [49] "ББкол.во.суток.назн" "антаг.кальция" [51] "АКдоза.суточная" "АКкол.во.сут.назн" [53] "антиагреганты" "инг.АПФ" [55] "ИАПФсут.доза" "ИАПФкол.во.сут.назн" [57] "нитраты" "дигоксин" [59] "диуретики" "кордарон" [61] "гепарин" "трад.тер" [63] "операция1" "доступ1" [65] "время.операции1" "Время.опер.11" [67] "Время.опер.21" "Время.опер.31" [69] "время.переж.аорты1" "Вр.переж.аорты11" [71] "Вр.переж.аорты21" "кровопотеря1" [73] "кровопотеря11" "наруш.ритма00" [75] "рубц.измен00" "ЧСС00" [77] "ритм00" "наруш.пров00" [79] "PQ" "QRS" [81] "QT" "ST" [83] "з.Т" "Соколов.Лайон" [85] "корн..Индекс" "корн..Произв.е" [87] "минЧСС" "максЧСС" [89] "средЧСС" "ЖЭС" [91] "ЖЭС..к.во" "ЖТ" [93] "НЖЭС..к.во" "НЖТ..к.во" [95] "депрессия.ST" "АВ.блокады" [97] "пароксизмы.ФП" "ГЛЖ00" [99] "X.3" "зоны.гипо.и.акин00" [101] "КДР..см00" "КСР..см00" [103] "КДО..мл00" "индекс.КДО..00" [105] "КСО00" "инд.КСО00" [107] "ФВ00" "УО00" [109] "ТМЖП00" "ТЗСТ.ЛЖ00" [111] "X.4" "ММ.ЛЖ.формула.Devereux" [113] "ИММ.ЛЖ" "ПЗРВТ.00" [115] "КДР.ПЖ00" "ЛП00" [117] "d.аорты00" "ГДС.СДЛА00" [119] "диаст..Дисфункция00.1" "кальциноз.аорты00" [121] "наруш.ритма11" "ЧСС11" [123] "PQ11" "QRS11" [125] "QT11" "депрессия.ST11" [127] "з.Т11" "длит.ть.прех.ишемии11" [129] "очаг.измен11" "мин.ЧСС11" [131] "макс.ЧСС11" "средняя.ЧСС11" [133] "ЖЭС.по.Лауну11" "ЖЭС..к.во11" [135] "парные.ЖЭС11" "ЖТ11" [137] "НЖЭС.к.во11" "НЖТ.к.во11" [139] "депрессия.SТ11" "нар.е.пров11" [141] "пароксизмы.ФП11" "п.о.гипокинезия11" [143] "КДР11" "КСР11" [145] "КДО11" "инд.КДО11" [147] "КСО11" "инд.КСО11" [149] "ФВ11" "УО11" [151] "ТМЖП11" "ТЗСТ.ЛЖ11" [153] "ММ.ЛЖ.формула.Devereux.1" "ИММ.ЛЖ.1" [155] "ПЗРВТ.11" "КДР.ПЖ11" [157] "ЛП11" "d.аорты11" [159] "ГДС.СДЛА11" "бета.блокеры11" [161] "доза11ББ" "ББкол.во.суток.назначения.пре11" [163] "антагонисты.кальция11" "АГдоза.суточная11" [165] "АГкол.во.суток.назн11" "антиагреганты11" [167] "инг.АПФ11" "ИАПФсуточная.доза11" [169] "ИАПФкол.во.суток.назн11" "нитраты11" [171] "дигоксин11" "диуретики11" [173] "кордарон11" "гепарин11" [175] "трад.терапия11" какие номера являются осложнениями? или какие являются предикторами? вот например я предполагаю что осложнение это: Код > (read.csv2("mp3gl.csv")$"постинф.кардиоскл") [1] 1 1 1 1 0 1 1 1 0 0 0 1 1 0 1 0 1 0 0 1 1 0 1 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 [39] 1 0 1 1 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 1 [77] 0 0 0 0 0 0 0 1 0 1 1 0 0 1 1 0 0 0 0 а предикторы это со 2 по 18ю Код > names(data[,2:18]) [1] "пол" "возраст" [3] "ИМТ..кг.м2" "ИМТ" [5] "S.тела.по.Дюб" "к.во.дней.до.опер" [7] "к.во.дней.после.опер" "время.уст..я.д.за.анев" [9] "кардио.жалобы" "длит.кардиожалоб" [11] "хирург.жалобы" "группы.по.лечению" [13] "п.о.кард.осложн" "Кард.осл.я" [15] "летальность" "стресс.ЭхоКГ" [17] "к.во.зон.гипо.и.акинезии" поскольку среди предикторов много пропусков перед нами два пути: 1) исключить случаи в которых есть пропуски Код > data.na<-na.omit(data[,c(2:18,25)]) > table(data.na$постинф.кардиоскл) 0 1 8 18 > rf<-randomForest(data.na[,-18],factor(data.na$"постинф.кардиоскл"), proximity=TRUE) > rf Call: randomForest(x = data.na[, -18], y = factor(data.na$постинф.кардиоскл), proximity = TRUE) Type of random forest: classification Number of trees: 500 No. of variables tried at each split: 4 OOB estimate of error rate: 38.46% Confusion matrix: 0 1 class.error 0 0 8 1.0000000 1 2 16 0.1111111 > MDSplot(rf, factor(data.na$"постинф.кардиоскл"), k=3) > varImpPlot(rf) как видим ничего в таком варианте модель не разделяет ничего. 2) заполним пропущенные случаи прибегнув к множественной импутации Код > data.2.18.impute<-rfImpute(data[,2:18],factor(data$"постинф.кардиоскл"), iter=5) ntree OOB 1 2 300: 26.32% 10.94% 58.06% ntree OOB 1 2 300: 27.37% 14.06% 54.84% ntree OOB 1 2 300: 27.37% 15.62% 51.61% ntree OOB 1 2 300: 26.32% 14.06% 51.61% ntree OOB 1 2 300: 29.47% 17.19% 54.84% > rf.impute<-randomForest(data.2.18.impute[,-1],data.2.18.impute[,1], proximity=TRUE) > rf.impute Call: randomForest(x = data.2.18.impute[, -1], y = data.2.18.impute[, 1], proximity = TRUE) Type of random forest: classification Number of trees: 500 No. of variables tried at each split: 4 OOB estimate of error rate: 29.47% Confusion matrix: 0 1 class.error 0 54 10 0.1562500 1 18 13 0.5806452 > MDSplot(rf.impute, data.2.18.impute[,1], k=3) > varImpPlot(rf.impute) > plot(importance(rf.impute),varUsed(rf.impute)) > text(importance(rf.impute),varUsed(rf.impute), labels= names(data.2.18.impute[,-1])) получается имеют влияние предикторы: "ИМТ..кг.м2", "к.во.зон.гипо.и.акинезии", "длит.кардиожалоб", "возраст", "к.во.дней.после.опер". меньше влияет "к.во.дней.до.опер". и совсем слабо (но еще влияет) "S.тела.по.Дюб", "кардио.жалобы", "стресс.ЭхоКГ", "хирург.жалобы", "группы.по.лечению". Естественно эту информацию можно накопить относительно различных осложнений и построить общую картину. Так какие показатели являются осложнениями? или какие являются предикторами к осложнениям? Скорее всего "группы.по.лечению" я зря в предикторы включал? ![]() |
|
|
![]() |
![]() |
Zaycho Определение чувствительности и специфичности комбинации маркеров 2.08.2012 - 14:20
p2004r Цитата(Zaycho @ 2.08.2012 - 14:20) З... 2.08.2012 - 14:24
Zaycho Цитата(p2004r @ 2.08.2012 - 15:24) м... 2.08.2012 - 14:37
p2004r Цитата(Zaycho @ 2.08.2012 - 14:37) B... 2.08.2012 - 19:38
Zaycho А можно я все-таки покажу исходные данные?
А, В и ... 2.08.2012 - 21:55
p2004r Цитата(Zaycho @ 2.08.2012 - 21:55) А... 3.08.2012 - 12:04
Zaycho Огромное спасибо за разъяснения! А можете тепе... 3.08.2012 - 14:27
p2004r Цитата(Zaycho @ 3.08.2012 - 14:27) О... 3.08.2012 - 14:59
Zaycho Глубокоуважаемый p2004r, правильно ли я понял, что... 3.08.2012 - 16:05
p2004r Цитата(Zaycho @ 3.08.2012 - 16:05) Г... 3.08.2012 - 16:30
Zaycho Я вконец запутался. А,В и С - это параметры, не вл... 3.08.2012 - 16:38
p2004r Цитата(Zaycho @ 3.08.2012 - 16:38) Я... 3.08.2012 - 19:29
TheThing Цитата(Zaycho @ 2.08.2012 - 14:20) З... 3.08.2012 - 08:55
TheThing Согласно моим расчетам лишь фактор С (тяжесть сост... 3.08.2012 - 20:07
p2004r Цитата(TheThing @ 3.08.2012 - 20:07)... 3.08.2012 - 21:12
TheThing значит логистическая регрессия и рэндом форест даю... 3.08.2012 - 21:22
p2004r Цитата(TheThing @ 3.08.2012 - 21:22)... 3.08.2012 - 21:48
DrgLena А если не лес строить, а одно дерево, то при одном... 3.08.2012 - 23:56
p2004r Цитата(DrgLena @ 3.08.2012 - 23:56) ... 4.08.2012 - 10:42
p2004r собственно да, svm получше выделяет
Код> mode... 4.08.2012 - 11:18
p2004r линеаризирующее преобразование (!после отрезан... 4.08.2012 - 11:41
Zaycho Коллеги, а если вернуться к посту #14, то как опре... 5.08.2012 - 11:23
p2004r Цитата(Zaycho @ 5.08.2012 - 11:23) К... 5.08.2012 - 12:55
Zaycho Да, я и не предполагал, что задача окажется не так... 4.08.2012 - 09:39
TheThing Решил сделать рэндом форест, а также построить про... 5.08.2012 - 15:37
p2004r и все таки, после применения правила С>25, оста... 5.08.2012 - 15:56
TheThing Кстати, вот хорошая статья, где проводился сравнит... 5.08.2012 - 16:40
p2004r Цитата(TheThing @ 5.08.2012 - 16:40)... 5.08.2012 - 19:05
Диана Раз зашла речь про ROC-анализ в программе SPSS под... 16.08.2012 - 09:25
TheThing Цитата(Диана @ 16.08.2012 - 09:25) Р... 16.08.2012 - 15:38
Диана Цитата(TheThing @ 16.08.2012 - 16:38... 16.08.2012 - 20:10
p2004r Цитата(Диана @ 16.08.2012 - 20:10) С... 16.08.2012 - 21:53
TheThing Цитата(Диана @ 16.08.2012 - 20:10) С... 16.08.2012 - 22:34
Диана я немножко сократила таблицу, убрала малоинтересую... 17.08.2012 - 18:05
p2004r Цитата(Диана @ 17.08.2012 - 18:05) я... 17.08.2012 - 22:26
Диана Факторы риска:
2
3
5 ... 18.08.2012 - 08:58
p2004r Цитата(Диана @ 18.08.2012 - 08:58) Ф... 18.08.2012 - 13:18
Диана спасибо за помощь. колонки 44-46 не имеют влияние... 18.08.2012 - 20:57
p2004r Цитата(Диана @ 18.08.2012 - 20:57) с... 18.08.2012 - 22:37
Диана колонки 44А 45А 46А были перекодированные колонки ... 19.08.2012 - 09:21
Диана Подскажите кто знает: возможно ли удалить выложенн... 26.08.2012 - 08:57
Диана ничего не получается, от проводимого лечения нет д... 26.08.2012 - 08:59
p2004r Цитата(Диана @ 26.08.2012 - 08:59) н... 27.08.2012 - 15:12
Диана Цитата(p2004r @ 27.08.2012 - 16:12) ... 27.08.2012 - 16:58
p2004r Цитата(Диана @ 27.08.2012 - 16:58) з... 27.08.2012 - 17:14
Диана 2) "влияет ли тип операции на снижение частот... 27.08.2012 - 17:42
Диана Хорошо, 13 колонка делит пациентов на 3 группы. Ле... 27.08.2012 - 17:25
Диана 1) влияет ли снижение ЧСС до операции на снижение ... 27.08.2012 - 17:29
p2004r Цитата(Диана @ 27.08.2012 - 17:29) 1... 27.08.2012 - 22:24
Диана супер, в мозаичных графиках данные очень наглядно ... 28.08.2012 - 09:02
p2004r Цитата(Диана @ 28.08.2012 - 09:02) с... 28.08.2012 - 12:07
Диана у меня есть данные факторного анализа, но, как сей... 28.08.2012 - 13:46
p2004r Цитата(Диана @ 28.08.2012 - 13:46) у... 28.08.2012 - 19:54
Диана RE: Определение чувствительности и специфичности комбинации маркеров 28.08.2012 - 21:10
p2004r Цитата(Диана @ 28.08.2012 - 21:10)
... 31.08.2012 - 16:49
Диана фактически группы две - 1 и 3, вторая размазана ме... 1.09.2012 - 22:22
Диана не могу разобраться с 3 графиком, какой то он слож... 1.09.2012 - 22:26
p2004r Цитата(Диана @ 1.09.2012 - 22:26) н... 3.09.2012 - 18:18
p2004r Для новых данных надо заново номера переменных соб... 7.09.2012 - 20:00
p2004r Цитата(p2004r @ 7.09.2012 - 20:00) Д... 10.09.2012 - 11:33
Диана ГБ : int 3 3 3 3 3 3 3 3 3 3 .... 10.09.2012 - 21:47![]() ![]() |