Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Логистическая регрессия?
mamalita
сообщение 9.11.2011 - 11:07
Сообщение #1





Группа: Пользователи
Сообщений: 49
Регистрация: 7.04.2010
Пользователь №: 15366



Добрый день! Прошу помощи в анализе данных. Мы имеем 100 человека больных с метастазами в печени, лечили их хирургическим путем и наблюдали их в течение 6 лет и диагностировали у них новые метастазы и рецидивы. Суть работы заключается в том, чтобы доказать, что реже всего на 1 и 2 годах наблюдения новые МТС возникают у пациентов с количеством МТС 2-3 (у нас были варианты количества от 2-6), и размер их должен быть 2-3 см. То есть кривая частоты прогресии имеет форму колокола обращенного вершиной вниз - 1 см - часто возникает прогрессия, больше 3 - тоже. Наиболее оптимальным является размер очага для хирургического лечения 2-3 см. Вопрос как представить эти данные и их анализировать: средний и суммарный размер не учитывают разницы: то ли у больного было 3 очага по 2 см то ли 1 и 6 см что совсем не благоприятно. Если брать каждый метастаз как отдельную переменную то у разных людей будет разное количество переменных (от 2 до 6штук), но этот вариант наиболее приемлем в соответствии с поставленной задачей. Теперь вопрос каким методом воспользоваться, чтобы доказать что идеальным для лечения является количество МТС 2-3 при размере 2-3см. Еще момент : размер МТС имеет мини манимальное округление до 0, 5 разброс от 1 до 6 см (т.е. всего 12 значений). Может быть их можно как-то объединить и логически видоизменить? Я уже просто голову сломала. Очень нужен свежий взгляд. Спасибо
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
DrgLena
сообщение 17.11.2011 - 19:46
Сообщение #2





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Что то, все же, настораживает в этом подходе. Как трактовать отрицательное значение коэффициента при второй категории размера. И отношение шансов и стандартизированное отношение шансов для второй категории меньше единицы. Т.е. чем больше таких размеров, тем меньше вероятность рецидива, т.е лучше для прогноза? Должна же быть клиническая логика любого моделирования.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 17.11.2011 - 20:45
Сообщение #3





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(DrgLena @ 17.11.2011 - 18:46) *
Что то, все же, настораживает в этом подходе. Как трактовать отрицательное значение коэффициента при второй категории размера. И отношение шансов и стандартизированное отношение шансов для второй категории меньше единицы. Т.е. чем больше таких размеров, тем меньше вероятность рецидива, т.е лучше для прогноза? Должна же быть клиническая логика любого моделирования.


Трактуется только оптимальная модель. В её составе интерцепт, число самых малых и число самых больших.

В целом влияние число опухолей различных размеров интерпретировать можно на вот таком бублеплоте.

вот его основа, пространство принципиальных компонент без извлечения средних и шкалирования. фактически те же данные только повернута система координат.
Код
> result.pca<-prcomp(result, scale.=FALSE, center=FALSE)
> plot(result.pca)
> biplot(result.pca)
> biplot(result.pca, choices=3:2)


крутить 3д график в форуме неудобно ограничимся серией бублеплотов (для сокращения размеров кода объявим функцию)

размер кружков это "срок", их заливка признак нулевого числа в интервале группировки номер которого написан в заглавии картинки

Код
> plot.res.n <- function (res.n) {
+   plot(result.pca$x[,3],
+        result.pca$x[,2],
+        bg=c("grey50","white")[as.factor(result[,res.n]==0)],
+        pch=21,
+        cex=seq(1,3, length.out=12)[as.factor(data$срок)], main=res.n)}
> plot.res.n(1)
> plot.res.n(2)
> plot.res.n(3)
> plot.res.n(4)
> plot.res.n(5)


с градиентом размеров кружком совпадают 1,5 и 4й интервал группировки размеров опухоли. Причем 5 работает и в направлении суммарного размера опухоли (первая компонента судя по всему его пытается восстановить).

2й интервал группировки работает против градиента "срок". 3й я бы сказал ортогонален градиенту "срок".

Как то так.
Эскизы прикрепленных изображений
Прикрепленное изображение
Прикрепленное изображение
Прикрепленное изображение
Прикрепленное изображение


Прикрепленное изображение
Прикрепленное изображение
Прикрепленное изображение
Прикрепленное изображение


Прикрепленное изображение
 


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- mamalita   Логистическая регрессия?   9.11.2011 - 11:07
- - p2004r   Цитата(mamalita @ 9.11.2011 - 10:07)...   9.11.2011 - 11:55
- - mamalita   Познания у меня не очень глубокие, поэтому не совс...   10.11.2011 - 12:35
|- - p2004r   Цитата(mamalita @ 10.11.2011 - 11:35...   10.11.2011 - 22:56
- - Игорь   Цитата(mamalita @ 9.11.2011 - 11:07)...   10.11.2011 - 15:50
- - mamalita   В том то и проблема - какой размер брать. Когда у ...   10.11.2011 - 20:40
- - DrgLena   Трудность понятна, есть не просто число, но и разм...   10.11.2011 - 22:49
- - mamalita   Цитата(DrgLena @ 10.11.2011 - 23:49)...   13.11.2011 - 11:29
|- - p2004r   Цитата(mamalita @ 13.11.2011 - 10:29...   13.11.2011 - 11:42
- - mamalita   приложенные данные   13.11.2011 - 11:34
|- - p2004r   Цитата(mamalita @ 13.11.2011 - 10:34...   13.11.2011 - 11:56
|- - p2004r   часть 2 Выбираем интервал группировки Нас интерес...   13.11.2011 - 13:16
|- - p2004r   часть 3 Применяем интервал группировки Допустим ч...   13.11.2011 - 14:14
|- - p2004r   Проведем разведочный анализ лично я предпочитаю с...   13.11.2011 - 15:21
|- - p2004r   Построим полную модель различий Код> summary...   13.11.2011 - 16:31
|- - p2004r   Посмотрим что увидела оптимальная модель Кодmosaic...   13.11.2011 - 17:04
|- - p2004r   Поскольку у крупных опухолей всего два уровня (ест...   13.11.2011 - 18:05
- - p2004r   нет ли опечатки? Код> table(data$сро...   13.11.2011 - 18:27
|- - mamalita   Спасибо за быстрый подробный ответ и помощь. Ноя к...   16.11.2011 - 08:58
|- - p2004r   Цитата(mamalita @ 16.11.2011 - 07:58...   16.11.2011 - 11:24
- - DrgLena   Поскольку дискуссия с автором поста пока не получа...   15.11.2011 - 00:37
|- - mamalita   Поскольку дискуссия с автором поста пока не получа...   16.11.2011 - 08:44
- - DrgLena   Нет, вы поняли не правильно. Хотя я много чего н...   16.11.2011 - 10:53
- - DrgLena   Цитата(p2004r @ 16.11.2011 - 12:24) ...   16.11.2011 - 13:29
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 12:29)...   16.11.2011 - 14:04
- - DrgLena   Цитата(p2004r @ 16.11.2011 - 11:24) ...   16.11.2011 - 13:37
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 12:37)...   16.11.2011 - 14:14
- - DrgLena   Больной, имеющий 0,5 имеет и 4 (вторая строчка)   16.11.2011 - 14:12
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 13:12)...   16.11.2011 - 14:20
- - mamalita   Цитата(p2004r @ 16.11.2011 - 15:20) ...   16.11.2011 - 18:06
|- - p2004r   да правильно, просто включать нельзя по тому что п...   16.11.2011 - 18:34
- - DrgLena   Цитата(p2004r @ 16.11.2011 - 15:04) ...   16.11.2011 - 19:22
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 18:22)...   16.11.2011 - 20:08
- - DrgLena   Спасибо, я тоже посчитала вероятности по вашим коэ...   16.11.2011 - 20:55
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 19:55)...   16.11.2011 - 21:07
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 19:55)...   16.11.2011 - 21:19
- - DrgLena   Спасибо, я уже перевела и скопировала ваши вероятн...   16.11.2011 - 21:40
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 20:40)...   16.11.2011 - 21:53
|- - p2004r   Цитата(DrgLena @ 16.11.2011 - 21:40)...   18.12.2011 - 17:16
- - DrgLena   Спасибо, р2004r, я поняла, для меня это новая мысл...   16.11.2011 - 22:41
- - DrgLena   Что то, все же, настораживает в этом подходе. Как ...   17.11.2011 - 19:46
|- - p2004r   Цитата(DrgLena @ 17.11.2011 - 18:46)...   17.11.2011 - 20:45
|- - p2004r   Цитата(DrgLena @ 17.11.2011 - 18:46)...   17.11.2011 - 20:52
|- - p2004r   Цитата(DrgLena @ 17.11.2011 - 18:46)...   17.11.2011 - 21:38
|- - DrgLena   Да, но ведь анализ данных для того и делается, что...   18.11.2011 - 00:58
|- - p2004r   Цитата(DrgLena @ 18.11.2011 - 00:58)...   18.11.2011 - 10:53
- - DrgLena   p2004r, вы продемонстрировали, что моделирование -...   18.11.2011 - 11:56
- - mamalita   Медленно но верно тем самым и занимаюсь. Мне нужно...   25.11.2011 - 11:16
- - mamalita   Начала с самого начала и сразу проблема: при откры...   5.12.2011 - 12:47
|- - p2004r   Цитата(mamalita @ 5.12.2011 - 12:47)...   5.12.2011 - 13:21
- - mamalita   Все делаю как написано программа отвечает : не мог...   6.12.2011 - 13:38
|- - p2004r   Цитата(mamalita @ 6.12.2011 - 13:38)...   6.12.2011 - 14:30
- - mamalita   [quote name='p2004r' date='6.12.2011 -...   8.12.2011 - 19:58
|- - p2004r   Цитата(mamalita @ 8.12.2011 - 19:58)...   8.12.2011 - 21:35
- - mamalita   > data <- read.csv2("кол-во-размер-реци...   11.12.2011 - 21:22
|- - p2004r   Цитата(mamalita @ 11.12.2011 - 21:22...   12.12.2011 - 00:42
- - mamalita   Спасибо, данные ввелись. Вопрос 1. вместо имен пер...   13.12.2011 - 10:34
- - p2004r   Цитата(mamalita @ 13.12.2011 - 10:34...   13.12.2011 - 10:50


Добавить ответ в эту темуОткрыть тему