Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Логистическая регрессия?
mamalita
сообщение 9.11.2011 - 11:07
Сообщение #1





Группа: Пользователи
Сообщений: 49
Регистрация: 7.04.2010
Пользователь №: 15366



Добрый день! Прошу помощи в анализе данных. Мы имеем 100 человека больных с метастазами в печени, лечили их хирургическим путем и наблюдали их в течение 6 лет и диагностировали у них новые метастазы и рецидивы. Суть работы заключается в том, чтобы доказать, что реже всего на 1 и 2 годах наблюдения новые МТС возникают у пациентов с количеством МТС 2-3 (у нас были варианты количества от 2-6), и размер их должен быть 2-3 см. То есть кривая частоты прогресии имеет форму колокола обращенного вершиной вниз - 1 см - часто возникает прогрессия, больше 3 - тоже. Наиболее оптимальным является размер очага для хирургического лечения 2-3 см. Вопрос как представить эти данные и их анализировать: средний и суммарный размер не учитывают разницы: то ли у больного было 3 очага по 2 см то ли 1 и 6 см что совсем не благоприятно. Если брать каждый метастаз как отдельную переменную то у разных людей будет разное количество переменных (от 2 до 6штук), но этот вариант наиболее приемлем в соответствии с поставленной задачей. Теперь вопрос каким методом воспользоваться, чтобы доказать что идеальным для лечения является количество МТС 2-3 при размере 2-3см. Еще момент : размер МТС имеет мини манимальное округление до 0, 5 разброс от 1 до 6 см (т.е. всего 12 значений). Может быть их можно как-то объединить и логически видоизменить? Я уже просто голову сломала. Очень нужен свежий взгляд. Спасибо
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
DrgLena
сообщение 16.11.2011 - 21:40
Сообщение #2





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Спасибо, я уже перевела и скопировала ваши вероятности. Для посчитанных мною по вашим коэффициентам, приведенным выше, значение площади ROC максимально=0,85, по приведенным вами вероятностям, чуть ниже 0,83. А по моей модели учитывающей только число и макс размер 0,79. Статистически площади на различаются. Т.о. вы своим подходом используете несколько больше информации заложенной в данных. Вот только как получить используемую вами трансформацию данных, хотелось бы посмотреть ссылки на литературу.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 18.12.2011 - 17:16
Сообщение #3





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(DrgLena @ 16.11.2011 - 21:40) *
Для посчитанных мною по вашим коэффициентам, приведенным выше, значение площади ROC максимально=0,85, по приведенным вами вероятностям, чуть ниже 0,83. А по моей модели учитывающей только число и макс размер 0,79. Статистически площади на различаются.


Отличная библиотека для работы с ROC, развитая графика

http://web.expasy.org/pROC/

встроенный бутстреп используется легко и непринужденно smile.gif

Код
> library(pROC)
> a<-roc(data$рецидив.до.года, read.csv2("predict.csv")[,2])

> plot(a)

> ci.auc(a, boot.n=10000)
95% CI: 0.7322-0.9233 (DeLong)

> ci.se(a, boot.n=10000)
Loading required package: tcltk
Загружаю интерфейс Tcl/Tk... готово
95% CI (10000 stratified bootstrap replicates):
  sp  se.low se.median se.high
0.0 1.00000    1.0000  1.0000
0.1 0.98740    0.9969  1.0000
0.2 0.97270    0.9937  1.0000
0.3 0.94000    0.9906  1.0000
0.4 0.80300    0.9851  1.0000
0.5 0.72730    0.9154  1.0000
0.6 0.68480    0.8182  0.9864
0.7 0.64050    0.7727  0.8982
0.8 0.54850    0.7091  0.8485
0.9 0.05114    0.6015  0.7631
1.0 0.00000    0.0000  0.6364

> ci.sp(a, boot.n=10000)
95% CI (10000 stratified bootstrap replicates):
  se sp.low sp.median sp.high
0.0 1.0000    1.0000  1.0000
0.1 0.8889    0.9630  1.0000
0.2 0.8889    0.9630  1.0000
0.3 0.8519    0.9630  1.0000
0.4 0.8148    0.9274  1.0000
0.5 0.8148    0.9259  1.0000
0.6 0.7556    0.9048  1.0000
0.7 0.5580    0.8112  0.9585
0.8 0.4111    0.6444  0.8691
0.9 0.3352    0.5136  0.6963
1.0 0.0000    0.0000  0.5926

> ci.thresholds(a, boot.n=10000)
95% CI (10000 stratified bootstrap replicates):
thresholds sp.low sp.median sp.high se.low se.median se.high
       -Inf 0.0000    0.0000  0.0000 1.0000    1.0000  1.0000
  0.3723259 0.2593    0.4444  0.6296 0.9545    0.9848  1.0000
  0.6950756 0.5185    0.7037  0.8519 0.6818    0.7879  0.8788
  0.8096497 0.8148    0.9259  1.0000 0.4697    0.5909  0.7121
  0.9343796 0.8889    0.9630  1.0000 0.2273    0.3333  0.4394
        Inf 1.0000    1.0000  1.0000 0.0000    0.0000  0.0000

sens.ci <- ci.se(a, specificities=seq(0, 1, .1))
     plot(sens.ci, type="shape", col="lightblue")

sens.cp <- ci.sp(a, specificities=seq(0, 1, .1))
     plot(sens.cp, type="shape", col="blue")

     plot(sens.cp, type="bars")
     plot(sens.ci, type="bars")

Эскизы прикрепленных изображений
Прикрепленное изображение
 


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- mamalita   Логистическая регрессия?   9.11.2011 - 11:07
- - p2004r   Цитата(mamalita @ 9.11.2011 - 10:07)...   9.11.2011 - 11:55
- - mamalita   Познания у меня не очень глубокие, поэтому не совс...   10.11.2011 - 12:35
|- - p2004r   Цитата(mamalita @ 10.11.2011 - 11:35...   10.11.2011 - 22:56
- - Игорь   Цитата(mamalita @ 9.11.2011 - 11:07)...   10.11.2011 - 15:50
- - mamalita   В том то и проблема - какой размер брать. Когда у ...   10.11.2011 - 20:40
- - DrgLena   Трудность понятна, есть не просто число, но и разм...   10.11.2011 - 22:49
- - mamalita   Цитата(DrgLena @ 10.11.2011 - 23:49)...   13.11.2011 - 11:29
|- - p2004r   Цитата(mamalita @ 13.11.2011 - 10:29...   13.11.2011 - 11:42
- - mamalita   приложенные данные   13.11.2011 - 11:34
|- - p2004r   Цитата(mamalita @ 13.11.2011 - 10:34...   13.11.2011 - 11:56
|- - p2004r   часть 2 Выбираем интервал группировки Нас интерес...   13.11.2011 - 13:16
|- - p2004r   часть 3 Применяем интервал группировки Допустим ч...   13.11.2011 - 14:14
|- - p2004r   Проведем разведочный анализ лично я предпочитаю с...   13.11.2011 - 15:21
|- - p2004r   Построим полную модель различий Код> summary...   13.11.2011 - 16:31
|- - p2004r   Посмотрим что увидела оптимальная модель Кодmosaic...   13.11.2011 - 17:04
|- - p2004r   Поскольку у крупных опухолей всего два уровня (ест...   13.11.2011 - 18:05
- - p2004r   нет ли опечатки? Код> table(data$сро...   13.11.2011 - 18:27
|- - mamalita   Спасибо за быстрый подробный ответ и помощь. Ноя к...   16.11.2011 - 08:58
|- - p2004r   Цитата(mamalita @ 16.11.2011 - 07:58...   16.11.2011 - 11:24
- - DrgLena   Поскольку дискуссия с автором поста пока не получа...   15.11.2011 - 00:37
|- - mamalita   Поскольку дискуссия с автором поста пока не получа...   16.11.2011 - 08:44
- - DrgLena   Нет, вы поняли не правильно. Хотя я много чего н...   16.11.2011 - 10:53
- - DrgLena   Цитата(p2004r @ 16.11.2011 - 12:24) ...   16.11.2011 - 13:29
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 12:29)...   16.11.2011 - 14:04
- - DrgLena   Цитата(p2004r @ 16.11.2011 - 11:24) ...   16.11.2011 - 13:37
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 12:37)...   16.11.2011 - 14:14
- - DrgLena   Больной, имеющий 0,5 имеет и 4 (вторая строчка)   16.11.2011 - 14:12
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 13:12)...   16.11.2011 - 14:20
- - mamalita   Цитата(p2004r @ 16.11.2011 - 15:20) ...   16.11.2011 - 18:06
|- - p2004r   да правильно, просто включать нельзя по тому что п...   16.11.2011 - 18:34
- - DrgLena   Цитата(p2004r @ 16.11.2011 - 15:04) ...   16.11.2011 - 19:22
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 18:22)...   16.11.2011 - 20:08
- - DrgLena   Спасибо, я тоже посчитала вероятности по вашим коэ...   16.11.2011 - 20:55
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 19:55)...   16.11.2011 - 21:07
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 19:55)...   16.11.2011 - 21:19
- - DrgLena   Спасибо, я уже перевела и скопировала ваши вероятн...   16.11.2011 - 21:40
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 20:40)...   16.11.2011 - 21:53
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 21:40)...   18.12.2011 - 17:16
- - DrgLena   Спасибо, р2004r, я поняла, для меня это новая мысл...   16.11.2011 - 22:41
- - DrgLena   Что то, все же, настораживает в этом подходе. Как ...   17.11.2011 - 19:46
|- - p2004r   Цитата(DrgLena @ 17.11.2011 - 18:46)...   17.11.2011 - 20:45
|- - p2004r   Цитата(DrgLena @ 17.11.2011 - 18:46)...   17.11.2011 - 20:52
|- - p2004r   Цитата(DrgLena @ 17.11.2011 - 18:46)...   17.11.2011 - 21:38
|- - DrgLena   Да, но ведь анализ данных для того и делается, что...   18.11.2011 - 00:58
|- - p2004r   Цитата(DrgLena @ 18.11.2011 - 00:58)...   18.11.2011 - 10:53
- - DrgLena   p2004r, вы продемонстрировали, что моделирование -...   18.11.2011 - 11:56
- - mamalita   Медленно но верно тем самым и занимаюсь. Мне нужно...   25.11.2011 - 11:16
- - mamalita   Начала с самого начала и сразу проблема: при откры...   5.12.2011 - 12:47
|- - p2004r   Цитата(mamalita @ 5.12.2011 - 12:47)...   5.12.2011 - 13:21
- - mamalita   Все делаю как написано программа отвечает : не мог...   6.12.2011 - 13:38
|- - p2004r   Цитата(mamalita @ 6.12.2011 - 13:38)...   6.12.2011 - 14:30
- - mamalita   [quote name='p2004r' date='6.12.2011 -...   8.12.2011 - 19:58
|- - p2004r   Цитата(mamalita @ 8.12.2011 - 19:58)...   8.12.2011 - 21:35
- - mamalita   > data <- read.csv2("кол-во-размер-реци...   11.12.2011 - 21:22
|- - p2004r   Цитата(mamalita @ 11.12.2011 - 21:22...   12.12.2011 - 00:42
- - mamalita   Спасибо, данные ввелись. Вопрос 1. вместо имен пер...   13.12.2011 - 10:34
- - p2004r   Цитата(mamalita @ 13.12.2011 - 10:34...   13.12.2011 - 10:50


Добавить ответ в эту темуОткрыть тему