Прогнозирование |
Здравствуйте, гость ( Вход | Регистрация )
Прогнозирование |
22.12.2013 - 08:18
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 22.12.2013 Пользователь №: 25769 |
Здравствуйте, сразу извиняюсь и прошу подробного объяснения. Мои познания в статистике заканчиваются на описательной и частично корреляции
Вопрос вот в чем. Есть база больных с большим количеством данных (около 80 характеристик) и есть исход через год (было или нет прогрессирование). Цель доказать, что есть какие то факторы, которые приведут к прогрессии |
|
22.12.2013 - 13:07
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Здравствуйте, сразу извиняюсь и прошу подробного объяснения. Мои познания в статистике заканчиваются на описательной и частично корреляции Вопрос вот в чем. Есть база больных с большим количеством данных (около 80 характеристик) и есть исход через год (было или нет прогрессирование). Цель доказать, что есть какие то факторы, которые приведут к прогрессии Стройте модель которая попытается предсказать исход по данным. Это может быть и логистическая регрессия и рандом форест и svm и что угодно другое из арсенала методов "с учителем". Можно сначала попробовать просто классификацию "без учителя" сделать. Если база не секретная просто положите её сюда (её можно анонимизировать). |
|
22.12.2013 - 15:33
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
Есть база больных с большим количеством данных (около 80 характеристик) и есть исход через год (было или нет прогрессирование). Цель доказать, что есть какие то факторы, которые приведут к прогрессии Если цель изучить именно влияние факторов на прогрессирование, то можно посчитать отношение шансов (ОШ) или относительный риск (ОР). Какой из показателей выбрать, зависит от того, ретроспективное или проспективное исследование. А если целью является создание модели с помощью которой можно прогнозировать будет прогрессирование или нет, то в данном случает надо использовать различные модели. По моему не очень большому опыту использования различных моделей лучшие результаты обычно дает нейросетевая модель. А базу, действительно, было бы посмотреть. Естественно деперсонализованную. Сообщение отредактировал paravoz - 22.12.2013 - 15:34 |
|
22.12.2013 - 19:54
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 22.12.2013 Пользователь №: 25769 |
Спасибо исследование ретроспективное. База не секретная, в каком формате прикрепить? Sta нормально будет?
|
|
22.12.2013 - 23:55
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Спасибо исследование ретроспективное. База не секретная, в каком формате прикрепить? Sta нормально будет? Лучше csv конечно . Но форум присоединяет только rar архивы, поэтому запаковать дополнительно. |
|
23.12.2013 - 01:13
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
|
|
23.12.2013 - 05:57
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 22.12.2013 Пользователь №: 25769 |
Базу прикрепила. Последние 4 ячейки это и есть исход по разным критериям. А все до них это оцениваемые показатели на первичном осмотре
Сообщение отредактировал Мотян - 23.12.2013 - 05:59
Прикрепленные файлы
|
|
24.12.2013 - 20:34
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Базу прикрепила. Последние 4 ячейки это и есть исход по разным критериям. А все до них это оцениваемые показатели на первичном осмотре Только желательно указать про переменные в какой шкале они измерены. Шкала наименования, ранговая, интервальная, отношений. Хотя бы указать шкалы наименований где использованы. |
|
25.12.2013 - 05:56
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 22.12.2013 Пользователь №: 25769 |
Исправила, где а-абсол величины, где н-номинальная шкала
Сообщение отредактировал Мотян - 25.12.2013 - 05:56
Прикрепленные файлы
|
|
25.12.2013 - 20:37
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Исправила, где а-абсол величины, где н-номинальная шкала Версия анализа ? 1 (ещё надо досчитать оптимальные модели и построить для них ROC).
Прикрепленные файлы
|
|
26.12.2013 - 18:34
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 22.12.2013 Пользователь №: 25769 |
Hи чего не поняла, прикрепленный файл посмотрела . Чем это считать? Извиняюсь за тупость, но не поняла
|
|
26.12.2013 - 20:06
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Hи чего не поняла, прикрепленный файл посмотрела . Чем это считать? Извиняюсь за тупость, но не поняла Вы так говорите, как будто это что то плохое Ничего считать собственно не надо, уже всё посчитано Сейчас оптимальные модели и ROC для них досчитаю и выложу. Вот собственно и посчитало. Там для каждой модели список переменных-предикторов из двух частей (условно "достоверные" и "слабо достоверные"). Каждая из моделей показала AUC (в пределах доверительного интервала). Это и есть искомое что требовалось в топике, хотя в принципе можно и логистическую регрессию посчитать для углублённого изучения взаимодействия предикторов. Можно наоборот более точную модель родить оптимизируя svm по кроссошибке. Как то так. Сообщение отредактировал p2004r - 26.12.2013 - 22:17
Прикрепленные файлы
|
|
9.01.2014 - 16:30
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 22.12.2013 Пользователь №: 25769 |
Огромное спасибо p2004r, сижу разбираюсь
Остался 1 вопрос чем это посчитано? |
|
10.01.2014 - 00:19
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Огромное спасибо p2004r, сижу разбираюсь Остался 1 вопрос чем это посчитано? Это R + knitr. Такая тенденция в современном исследовании когда всё исследование можно повторить в любой момент. Про R можно читать http://cran.r-project.org/ Перевод Введения в R http://m7876.wiki.zoho.com/Introduction-to-R.html Среда разработки http://www.rstudio.com/ TeX под винду не знаю какой лучше брать. В архиве исходники проекта. По идее если на компьютере есть Rstudio, LaTeX, R то можно его дописывать и перегенерировать pdf
Прикрепленные файлы
|
|