Здравствуйте, гость ( Вход | Регистрация )
9.11.2011 - 11:07
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 49 Регистрация: 7.04.2010 Пользователь №: 15366 |
Добрый день! Прошу помощи в анализе данных. Мы имеем 100 человека больных с метастазами в печени, лечили их хирургическим путем и наблюдали их в течение 6 лет и диагностировали у них новые метастазы и рецидивы. Суть работы заключается в том, чтобы доказать, что реже всего на 1 и 2 годах наблюдения новые МТС возникают у пациентов с количеством МТС 2-3 (у нас были варианты количества от 2-6), и размер их должен быть 2-3 см. То есть кривая частоты прогресии имеет форму колокола обращенного вершиной вниз - 1 см - часто возникает прогрессия, больше 3 - тоже. Наиболее оптимальным является размер очага для хирургического лечения 2-3 см. Вопрос как представить эти данные и их анализировать: средний и суммарный размер не учитывают разницы: то ли у больного было 3 очага по 2 см то ли 1 и 6 см что совсем не благоприятно. Если брать каждый метастаз как отдельную переменную то у разных людей будет разное количество переменных (от 2 до 6штук), но этот вариант наиболее приемлем в соответствии с поставленной задачей. Теперь вопрос каким методом воспользоваться, чтобы доказать что идеальным для лечения является количество МТС 2-3 при размере 2-3см. Еще момент : размер МТС имеет мини манимальное округление до 0, 5 разброс от 1 до 6 см (т.е. всего 12 значений). Может быть их можно как-то объединить и логически видоизменить? Я уже просто голову сломала. Очень нужен свежий взгляд. Спасибо
|
|
|
![]() |
![]() |
![]() |
16.11.2011 - 21:40
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Спасибо, я уже перевела и скопировала ваши вероятности. Для посчитанных мною по вашим коэффициентам, приведенным выше, значение площади ROC максимально=0,85, по приведенным вами вероятностям, чуть ниже 0,83. А по моей модели учитывающей только число и макс размер 0,79. Статистически площади на различаются. Т.о. вы своим подходом используете несколько больше информации заложенной в данных. Вот только как получить используемую вами трансформацию данных, хотелось бы посмотреть ссылки на литературу.
|
|
|
![]() |
![]() |
18.12.2011 - 17:16
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Для посчитанных мною по вашим коэффициентам, приведенным выше, значение площади ROC максимально=0,85, по приведенным вами вероятностям, чуть ниже 0,83. А по моей модели учитывающей только число и макс размер 0,79. Статистически площади на различаются. Отличная библиотека для работы с ROC, развитая графика http://web.expasy.org/pROC/ встроенный бутстреп используется легко и непринужденно Код > library(pROC)
> a<-roc(data$рецидив.до.года, read.csv2("predict.csv")[,2]) > plot(a) > ci.auc(a, boot.n=10000) 95% CI: 0.7322-0.9233 (DeLong) > ci.se(a, boot.n=10000) Loading required package: tcltk Загружаю интерфейс Tcl/Tk... готово 95% CI (10000 stratified bootstrap replicates): sp se.low se.median se.high 0.0 1.00000 1.0000 1.0000 0.1 0.98740 0.9969 1.0000 0.2 0.97270 0.9937 1.0000 0.3 0.94000 0.9906 1.0000 0.4 0.80300 0.9851 1.0000 0.5 0.72730 0.9154 1.0000 0.6 0.68480 0.8182 0.9864 0.7 0.64050 0.7727 0.8982 0.8 0.54850 0.7091 0.8485 0.9 0.05114 0.6015 0.7631 1.0 0.00000 0.0000 0.6364 > ci.sp(a, boot.n=10000) 95% CI (10000 stratified bootstrap replicates): se sp.low sp.median sp.high 0.0 1.0000 1.0000 1.0000 0.1 0.8889 0.9630 1.0000 0.2 0.8889 0.9630 1.0000 0.3 0.8519 0.9630 1.0000 0.4 0.8148 0.9274 1.0000 0.5 0.8148 0.9259 1.0000 0.6 0.7556 0.9048 1.0000 0.7 0.5580 0.8112 0.9585 0.8 0.4111 0.6444 0.8691 0.9 0.3352 0.5136 0.6963 1.0 0.0000 0.0000 0.5926 > ci.thresholds(a, boot.n=10000) 95% CI (10000 stratified bootstrap replicates): thresholds sp.low sp.median sp.high se.low se.median se.high -Inf 0.0000 0.0000 0.0000 1.0000 1.0000 1.0000 0.3723259 0.2593 0.4444 0.6296 0.9545 0.9848 1.0000 0.6950756 0.5185 0.7037 0.8519 0.6818 0.7879 0.8788 0.8096497 0.8148 0.9259 1.0000 0.4697 0.5909 0.7121 0.9343796 0.8889 0.9630 1.0000 0.2273 0.3333 0.4394 Inf 1.0000 1.0000 1.0000 0.0000 0.0000 0.0000 sens.ci <- ci.se(a, specificities=seq(0, 1, .1)) plot(sens.ci, type="shape", col="lightblue") sens.cp <- ci.sp(a, specificities=seq(0, 1, .1)) plot(sens.cp, type="shape", col="blue") plot(sens.cp, type="bars") plot(sens.ci, type="bars") ![]() |
|
|
![]() |
![]() |
mamalita Логистическая регрессия? 9.11.2011 - 11:07
p2004r Цитата(mamalita @ 9.11.2011 - 10:07)... 9.11.2011 - 11:55
mamalita Познания у меня не очень глубокие, поэтому не совс... 10.11.2011 - 12:35
p2004r Цитата(mamalita @ 10.11.2011 - 11:35... 10.11.2011 - 22:56
Игорь Цитата(mamalita @ 9.11.2011 - 11:07)... 10.11.2011 - 15:50
mamalita В том то и проблема - какой размер брать. Когда у ... 10.11.2011 - 20:40
DrgLena Трудность понятна, есть не просто число, но и разм... 10.11.2011 - 22:49
mamalita Цитата(DrgLena @ 10.11.2011 - 23:49)... 13.11.2011 - 11:29
p2004r Цитата(mamalita @ 13.11.2011 - 10:29... 13.11.2011 - 11:42
mamalita приложенные данные 13.11.2011 - 11:34
p2004r Цитата(mamalita @ 13.11.2011 - 10:34... 13.11.2011 - 11:56
p2004r часть 2 Выбираем интервал группировки
Нас интерес... 13.11.2011 - 13:16
p2004r часть 3 Применяем интервал группировки
Допустим ч... 13.11.2011 - 14:14
p2004r Проведем разведочный анализ
лично я предпочитаю с... 13.11.2011 - 15:21
p2004r Построим полную модель различий
Код> summary... 13.11.2011 - 16:31
p2004r Посмотрим что увидела оптимальная модель
Кодmosaic... 13.11.2011 - 17:04
p2004r Поскольку у крупных опухолей всего два уровня (ест... 13.11.2011 - 18:05
p2004r нет ли опечатки?
Код> table(data$сро... 13.11.2011 - 18:27
mamalita Спасибо за быстрый подробный ответ и помощь. Ноя к... 16.11.2011 - 08:58
p2004r Цитата(mamalita @ 16.11.2011 - 07:58... 16.11.2011 - 11:24
DrgLena Поскольку дискуссия с автором поста пока не получа... 15.11.2011 - 00:37
mamalita Поскольку дискуссия с автором поста пока не получа... 16.11.2011 - 08:44
DrgLena Нет, вы поняли не правильно.
Хотя я много чего н... 16.11.2011 - 10:53
DrgLena Цитата(p2004r @ 16.11.2011 - 12:24) ... 16.11.2011 - 13:29
p2004r Цитата(DrgLena @ 16.11.2011 - 12:29)... 16.11.2011 - 14:04
DrgLena Цитата(p2004r @ 16.11.2011 - 11:24) ... 16.11.2011 - 13:37
p2004r Цитата(DrgLena @ 16.11.2011 - 12:37)... 16.11.2011 - 14:14
DrgLena Больной, имеющий 0,5 имеет и 4 (вторая строчка) 16.11.2011 - 14:12
p2004r Цитата(DrgLena @ 16.11.2011 - 13:12)... 16.11.2011 - 14:20
mamalita Цитата(p2004r @ 16.11.2011 - 15:20) ... 16.11.2011 - 18:06
p2004r да правильно, просто включать нельзя по тому что п... 16.11.2011 - 18:34
DrgLena Цитата(p2004r @ 16.11.2011 - 15:04) ... 16.11.2011 - 19:22
p2004r Цитата(DrgLena @ 16.11.2011 - 18:22)... 16.11.2011 - 20:08
DrgLena Спасибо, я тоже посчитала вероятности по вашим коэ... 16.11.2011 - 20:55
p2004r Цитата(DrgLena @ 16.11.2011 - 19:55)... 16.11.2011 - 21:07
p2004r Цитата(DrgLena @ 16.11.2011 - 19:55)... 16.11.2011 - 21:19
p2004r Цитата(DrgLena @ 16.11.2011 - 20:40)... 16.11.2011 - 21:53
DrgLena Спасибо, р2004r, я поняла, для меня это новая мысл... 16.11.2011 - 22:41
DrgLena Что то, все же, настораживает в этом подходе. Как ... 17.11.2011 - 19:46
p2004r Цитата(DrgLena @ 17.11.2011 - 18:46)... 17.11.2011 - 20:45
p2004r Цитата(DrgLena @ 17.11.2011 - 18:46)... 17.11.2011 - 20:52
p2004r Цитата(DrgLena @ 17.11.2011 - 18:46)... 17.11.2011 - 21:38
DrgLena Да, но ведь анализ данных для того и делается, что... 18.11.2011 - 00:58
p2004r Цитата(DrgLena @ 18.11.2011 - 00:58)... 18.11.2011 - 10:53
DrgLena p2004r, вы продемонстрировали, что моделирование -... 18.11.2011 - 11:56
mamalita Медленно но верно тем самым и занимаюсь. Мне нужно... 25.11.2011 - 11:16
mamalita Начала с самого начала и сразу проблема: при откры... 5.12.2011 - 12:47
p2004r Цитата(mamalita @ 5.12.2011 - 12:47)... 5.12.2011 - 13:21
mamalita Все делаю как написано программа отвечает : не мог... 6.12.2011 - 13:38
p2004r Цитата(mamalita @ 6.12.2011 - 13:38)... 6.12.2011 - 14:30
mamalita [quote name='p2004r' date='6.12.2011 -... 8.12.2011 - 19:58
p2004r Цитата(mamalita @ 8.12.2011 - 19:58)... 8.12.2011 - 21:35
mamalita > data <- read.csv2("кол-во-размер-реци... 11.12.2011 - 21:22
p2004r Цитата(mamalita @ 11.12.2011 - 21:22... 12.12.2011 - 00:42
mamalita Спасибо, данные ввелись. Вопрос 1. вместо имен пер... 13.12.2011 - 10:34
p2004r Цитата(mamalita @ 13.12.2011 - 10:34... 13.12.2011 - 10:50![]() ![]() |