Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Прогнозирование
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Мотян
Здравствуйте, сразу извиняюсь и прошу подробного объяснения. Мои познания в статистике заканчиваются на описательной и частично корреляции
Вопрос вот в чем. Есть база больных с большим количеством данных (около 80 характеристик) и есть исход через год (было или нет прогрессирование). Цель доказать, что есть какие то факторы, которые приведут к прогрессии
p2004r
Цитата(Мотян @ 22.12.2013 - 08:18) *
Здравствуйте, сразу извиняюсь и прошу подробного объяснения. Мои познания в статистике заканчиваются на описательной и частично корреляции
Вопрос вот в чем. Есть база больных с большим количеством данных (около 80 характеристик) и есть исход через год (было или нет прогрессирование). Цель доказать, что есть какие то факторы, которые приведут к прогрессии


Стройте модель которая попытается предсказать исход по данным. Это может быть и логистическая регрессия и рандом форест и svm и что угодно другое из арсенала методов "с учителем". Можно сначала попробовать просто классификацию "без учителя" сделать.

Если база не секретная просто положите её сюда (её можно анонимизировать).
paravoz
Цитата(Мотян @ 22.12.2013 - 13:18) *
Есть база больных с большим количеством данных (около 80 характеристик) и есть исход через год (было или нет прогрессирование). Цель доказать, что есть какие то факторы, которые приведут к прогрессии


Если цель изучить именно влияние факторов на прогрессирование, то можно посчитать отношение шансов (ОШ) или относительный риск (ОР). Какой из показателей выбрать, зависит от того, ретроспективное или проспективное исследование.

А если целью является создание модели с помощью которой можно прогнозировать будет прогрессирование или нет, то в данном случает надо использовать различные модели. По моему не очень большому опыту использования различных моделей лучшие результаты обычно дает нейросетевая модель.

А базу, действительно, было бы посмотреть. Естественно деперсонализованную.
Мотян
Спасибо исследование ретроспективное. База не секретная, в каком формате прикрепить? Sta нормально будет?
p2004r
Цитата(Мотян @ 22.12.2013 - 19:54) *
Спасибо исследование ретроспективное. База не секретная, в каком формате прикрепить? Sta нормально будет?


Лучше csv конечно . Но форум присоединяет только rar архивы, поэтому запаковать дополнительно.
paravoz
Цитата(Мотян @ 23.12.2013 - 00:54) *
исследование ретроспективное.


В таком случае для определения влияния фактора на прогрессирование неободимо использовать отношение шансов.
Мотян
Базу прикрепила. Последние 4 ячейки это и есть исход по разным критериям. А все до них это оцениваемые показатели на первичном осмотре
p2004r
Цитата(Мотян @ 23.12.2013 - 05:57) *
Базу прикрепила. Последние 4 ячейки это и есть исход по разным критериям. А все до них это оцениваемые показатели на первичном осмотре


Только желательно указать про переменные в какой шкале они измерены. Шкала наименования, ранговая, интервальная, отношений. Хотя бы указать шкалы наименований где использованы.
Мотян
Исправила, где а-абсол величины, где н-номинальная шкала
p2004r
Цитата(Мотян @ 25.12.2013 - 05:56) *
Исправила, где а-абсол величины, где н-номинальная шкала


Версия анализа ? 1 (ещё надо досчитать оптимальные модели и построить для них ROC).
Мотян
Hи чего не поняла, прикрепленный файл посмотрела . Чем это считать? Извиняюсь за тупость, но не поняла
p2004r
Цитата(Мотян @ 26.12.2013 - 18:34) *
Hи чего не поняла, прикрепленный файл посмотрела . Чем это считать? Извиняюсь за тупость, но не поняла


Вы так говорите, как будто это что то плохое smile.gif Ничего считать собственно не надо, уже всё посчитано smile.gif Сейчас оптимальные модели и ROC для них досчитаю и выложу.

Вот собственно и посчитало.

Там для каждой модели список переменных-предикторов из двух частей (условно "достоверные" и "слабо достоверные"). Каждая из моделей показала AUC (в пределах доверительного интервала). Это и есть искомое что требовалось в топике, хотя в принципе можно и логистическую регрессию посчитать для углублённого изучения взаимодействия предикторов. Можно наоборот более точную модель родить оптимизируя svm по кроссошибке.

Как то так.
Мотян
Огромное спасибо p2004r, сижу разбираюсь
Остался 1 вопрос чем это посчитано?
p2004r
Цитата(Мотян @ 9.01.2014 - 16:30) *
Огромное спасибо p2004r, сижу разбираюсь
Остался 1 вопрос чем это посчитано?


Это R + knitr. Такая тенденция в современном исследовании когда всё исследование можно повторить в любой момент.

Про R можно читать http://cran.r-project.org/ Перевод Введения в R http://m7876.wiki.zoho.com/Introduction-to-R.html

Среда разработки http://www.rstudio.com/

TeX под винду не знаю какой лучше брать.

В архиве исходники проекта. По идее если на компьютере есть Rstudio, LaTeX, R то можно его дописывать и перегенерировать pdf
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.