Здравствуйте, гость ( Вход | Регистрация )
9.11.2011 - 11:07
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 49 Регистрация: 7.04.2010 Пользователь №: 15366 |
Добрый день! Прошу помощи в анализе данных. Мы имеем 100 человека больных с метастазами в печени, лечили их хирургическим путем и наблюдали их в течение 6 лет и диагностировали у них новые метастазы и рецидивы. Суть работы заключается в том, чтобы доказать, что реже всего на 1 и 2 годах наблюдения новые МТС возникают у пациентов с количеством МТС 2-3 (у нас были варианты количества от 2-6), и размер их должен быть 2-3 см. То есть кривая частоты прогресии имеет форму колокола обращенного вершиной вниз - 1 см - часто возникает прогрессия, больше 3 - тоже. Наиболее оптимальным является размер очага для хирургического лечения 2-3 см. Вопрос как представить эти данные и их анализировать: средний и суммарный размер не учитывают разницы: то ли у больного было 3 очага по 2 см то ли 1 и 6 см что совсем не благоприятно. Если брать каждый метастаз как отдельную переменную то у разных людей будет разное количество переменных (от 2 до 6штук), но этот вариант наиболее приемлем в соответствии с поставленной задачей. Теперь вопрос каким методом воспользоваться, чтобы доказать что идеальным для лечения является количество МТС 2-3 при размере 2-3см. Еще момент : размер МТС имеет мини манимальное округление до 0, 5 разброс от 1 до 6 см (т.е. всего 12 значений). Может быть их можно как-то объединить и логически видоизменить? Я уже просто голову сломала. Очень нужен свежий взгляд. Спасибо
|
|
|
![]() |
![]() |
![]() |
17.11.2011 - 19:46
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Что то, все же, настораживает в этом подходе. Как трактовать отрицательное значение коэффициента при второй категории размера. И отношение шансов и стандартизированное отношение шансов для второй категории меньше единицы. Т.е. чем больше таких размеров, тем меньше вероятность рецидива, т.е лучше для прогноза? Должна же быть клиническая логика любого моделирования.
|
|
|
![]() |
![]() |
17.11.2011 - 20:45
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Что то, все же, настораживает в этом подходе. Как трактовать отрицательное значение коэффициента при второй категории размера. И отношение шансов и стандартизированное отношение шансов для второй категории меньше единицы. Т.е. чем больше таких размеров, тем меньше вероятность рецидива, т.е лучше для прогноза? Должна же быть клиническая логика любого моделирования. Трактуется только оптимальная модель. В её составе интерцепт, число самых малых и число самых больших. В целом влияние число опухолей различных размеров интерпретировать можно на вот таком бублеплоте. вот его основа, пространство принципиальных компонент без извлечения средних и шкалирования. фактически те же данные только повернута система координат. Код > result.pca<-prcomp(result, scale.=FALSE, center=FALSE) > plot(result.pca) > biplot(result.pca) > biplot(result.pca, choices=3:2) крутить 3д график в форуме неудобно ограничимся серией бублеплотов (для сокращения размеров кода объявим функцию) размер кружков это "срок", их заливка признак нулевого числа в интервале группировки номер которого написан в заглавии картинки Код > plot.res.n <- function (res.n) { + plot(result.pca$x[,3], + result.pca$x[,2], + bg=c("grey50","white")[as.factor(result[,res.n]==0)], + pch=21, + cex=seq(1,3, length.out=12)[as.factor(data$срок)], main=res.n)} > plot.res.n(1) > plot.res.n(2) > plot.res.n(3) > plot.res.n(4) > plot.res.n(5) с градиентом размеров кружком совпадают 1,5 и 4й интервал группировки размеров опухоли. Причем 5 работает и в направлении суммарного размера опухоли (первая компонента судя по всему его пытается восстановить). 2й интервал группировки работает против градиента "срок". 3й я бы сказал ортогонален градиенту "срок". Как то так. ![]() |
|
|
![]() |
![]() |
mamalita Логистическая регрессия? 9.11.2011 - 11:07
p2004r Цитата(mamalita @ 9.11.2011 - 10:07)... 9.11.2011 - 11:55
mamalita Познания у меня не очень глубокие, поэтому не совс... 10.11.2011 - 12:35
p2004r Цитата(mamalita @ 10.11.2011 - 11:35... 10.11.2011 - 22:56
Игорь Цитата(mamalita @ 9.11.2011 - 11:07)... 10.11.2011 - 15:50
mamalita В том то и проблема - какой размер брать. Когда у ... 10.11.2011 - 20:40
DrgLena Трудность понятна, есть не просто число, но и разм... 10.11.2011 - 22:49
mamalita Цитата(DrgLena @ 10.11.2011 - 23:49)... 13.11.2011 - 11:29
p2004r Цитата(mamalita @ 13.11.2011 - 10:29... 13.11.2011 - 11:42
mamalita приложенные данные 13.11.2011 - 11:34
p2004r Цитата(mamalita @ 13.11.2011 - 10:34... 13.11.2011 - 11:56
p2004r часть 2 Выбираем интервал группировки
Нас интерес... 13.11.2011 - 13:16
p2004r часть 3 Применяем интервал группировки
Допустим ч... 13.11.2011 - 14:14
p2004r Проведем разведочный анализ
лично я предпочитаю с... 13.11.2011 - 15:21
p2004r Построим полную модель различий
Код> summary... 13.11.2011 - 16:31
p2004r Посмотрим что увидела оптимальная модель
Кодmosaic... 13.11.2011 - 17:04
p2004r Поскольку у крупных опухолей всего два уровня (ест... 13.11.2011 - 18:05
p2004r нет ли опечатки?
Код> table(data$сро... 13.11.2011 - 18:27
mamalita Спасибо за быстрый подробный ответ и помощь. Ноя к... 16.11.2011 - 08:58
p2004r Цитата(mamalita @ 16.11.2011 - 07:58... 16.11.2011 - 11:24
DrgLena Поскольку дискуссия с автором поста пока не получа... 15.11.2011 - 00:37
mamalita Поскольку дискуссия с автором поста пока не получа... 16.11.2011 - 08:44
DrgLena Нет, вы поняли не правильно.
Хотя я много чего н... 16.11.2011 - 10:53
DrgLena Цитата(p2004r @ 16.11.2011 - 12:24) ... 16.11.2011 - 13:29
p2004r Цитата(DrgLena @ 16.11.2011 - 12:29)... 16.11.2011 - 14:04
DrgLena Цитата(p2004r @ 16.11.2011 - 11:24) ... 16.11.2011 - 13:37
p2004r Цитата(DrgLena @ 16.11.2011 - 12:37)... 16.11.2011 - 14:14
DrgLena Больной, имеющий 0,5 имеет и 4 (вторая строчка) 16.11.2011 - 14:12
p2004r Цитата(DrgLena @ 16.11.2011 - 13:12)... 16.11.2011 - 14:20
mamalita Цитата(p2004r @ 16.11.2011 - 15:20) ... 16.11.2011 - 18:06
p2004r да правильно, просто включать нельзя по тому что п... 16.11.2011 - 18:34
DrgLena Цитата(p2004r @ 16.11.2011 - 15:04) ... 16.11.2011 - 19:22
p2004r Цитата(DrgLena @ 16.11.2011 - 18:22)... 16.11.2011 - 20:08
DrgLena Спасибо, я тоже посчитала вероятности по вашим коэ... 16.11.2011 - 20:55
p2004r Цитата(DrgLena @ 16.11.2011 - 19:55)... 16.11.2011 - 21:07
p2004r Цитата(DrgLena @ 16.11.2011 - 19:55)... 16.11.2011 - 21:19
DrgLena Спасибо, я уже перевела и скопировала ваши вероятн... 16.11.2011 - 21:40
p2004r Цитата(DrgLena @ 16.11.2011 - 20:40)... 16.11.2011 - 21:53
p2004r Цитата(DrgLena @ 16.11.2011 - 21:40)... 18.12.2011 - 17:16
DrgLena Спасибо, р2004r, я поняла, для меня это новая мысл... 16.11.2011 - 22:41
p2004r Цитата(DrgLena @ 17.11.2011 - 18:46)... 17.11.2011 - 20:52
p2004r Цитата(DrgLena @ 17.11.2011 - 18:46)... 17.11.2011 - 21:38
DrgLena Да, но ведь анализ данных для того и делается, что... 18.11.2011 - 00:58
p2004r Цитата(DrgLena @ 18.11.2011 - 00:58)... 18.11.2011 - 10:53
DrgLena p2004r, вы продемонстрировали, что моделирование -... 18.11.2011 - 11:56
mamalita Медленно но верно тем самым и занимаюсь. Мне нужно... 25.11.2011 - 11:16
mamalita Начала с самого начала и сразу проблема: при откры... 5.12.2011 - 12:47
p2004r Цитата(mamalita @ 5.12.2011 - 12:47)... 5.12.2011 - 13:21
mamalita Все делаю как написано программа отвечает : не мог... 6.12.2011 - 13:38
p2004r Цитата(mamalita @ 6.12.2011 - 13:38)... 6.12.2011 - 14:30
mamalita [quote name='p2004r' date='6.12.2011 -... 8.12.2011 - 19:58
p2004r Цитата(mamalita @ 8.12.2011 - 19:58)... 8.12.2011 - 21:35
mamalita > data <- read.csv2("кол-во-размер-реци... 11.12.2011 - 21:22
p2004r Цитата(mamalita @ 11.12.2011 - 21:22... 12.12.2011 - 00:42
mamalita Спасибо, данные ввелись. Вопрос 1. вместо имен пер... 13.12.2011 - 10:34
p2004r Цитата(mamalita @ 13.12.2011 - 10:34... 13.12.2011 - 10:50![]() ![]() |