Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Прогнозирование
Мотян
сообщение 22.12.2013 - 08:18
Сообщение #1





Группа: Пользователи
Сообщений: 7
Регистрация: 22.12.2013
Пользователь №: 25769



Здравствуйте, сразу извиняюсь и прошу подробного объяснения. Мои познания в статистике заканчиваются на описательной и частично корреляции
Вопрос вот в чем. Есть база больных с большим количеством данных (около 80 характеристик) и есть исход через год (было или нет прогрессирование). Цель доказать, что есть какие то факторы, которые приведут к прогрессии
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 22.12.2013 - 13:07
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Мотян @ 22.12.2013 - 08:18) *
Здравствуйте, сразу извиняюсь и прошу подробного объяснения. Мои познания в статистике заканчиваются на описательной и частично корреляции
Вопрос вот в чем. Есть база больных с большим количеством данных (около 80 характеристик) и есть исход через год (было или нет прогрессирование). Цель доказать, что есть какие то факторы, которые приведут к прогрессии


Стройте модель которая попытается предсказать исход по данным. Это может быть и логистическая регрессия и рандом форест и svm и что угодно другое из арсенала методов "с учителем". Можно сначала попробовать просто классификацию "без учителя" сделать.

Если база не секретная просто положите её сюда (её можно анонимизировать).


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 22.12.2013 - 15:33
Сообщение #3





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(Мотян @ 22.12.2013 - 13:18) *
Есть база больных с большим количеством данных (около 80 характеристик) и есть исход через год (было или нет прогрессирование). Цель доказать, что есть какие то факторы, которые приведут к прогрессии


Если цель изучить именно влияние факторов на прогрессирование, то можно посчитать отношение шансов (ОШ) или относительный риск (ОР). Какой из показателей выбрать, зависит от того, ретроспективное или проспективное исследование.

А если целью является создание модели с помощью которой можно прогнозировать будет прогрессирование или нет, то в данном случает надо использовать различные модели. По моему не очень большому опыту использования различных моделей лучшие результаты обычно дает нейросетевая модель.

А базу, действительно, было бы посмотреть. Естественно деперсонализованную.

Сообщение отредактировал paravoz - 22.12.2013 - 15:34
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Мотян
сообщение 22.12.2013 - 19:54
Сообщение #4





Группа: Пользователи
Сообщений: 7
Регистрация: 22.12.2013
Пользователь №: 25769



Спасибо исследование ретроспективное. База не секретная, в каком формате прикрепить? Sta нормально будет?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 22.12.2013 - 23:55
Сообщение #5





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Мотян @ 22.12.2013 - 19:54) *
Спасибо исследование ретроспективное. База не секретная, в каком формате прикрепить? Sta нормально будет?


Лучше csv конечно . Но форум присоединяет только rar архивы, поэтому запаковать дополнительно.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 23.12.2013 - 01:13
Сообщение #6





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(Мотян @ 23.12.2013 - 00:54) *
исследование ретроспективное.


В таком случае для определения влияния фактора на прогрессирование неободимо использовать отношение шансов.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Мотян
сообщение 23.12.2013 - 05:57
Сообщение #7





Группа: Пользователи
Сообщений: 7
Регистрация: 22.12.2013
Пользователь №: 25769



Базу прикрепила. Последние 4 ячейки это и есть исход по разным критериям. А все до них это оцениваемые показатели на первичном осмотре

Сообщение отредактировал Мотян - 23.12.2013 - 05:59
Прикрепленные файлы
Прикрепленный файл  Книга1.rar ( 32,12 килобайт ) Кол-во скачиваний: 325
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 24.12.2013 - 20:34
Сообщение #8





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Мотян @ 23.12.2013 - 05:57) *
Базу прикрепила. Последние 4 ячейки это и есть исход по разным критериям. А все до них это оцениваемые показатели на первичном осмотре


Только желательно указать про переменные в какой шкале они измерены. Шкала наименования, ранговая, интервальная, отношений. Хотя бы указать шкалы наименований где использованы.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Мотян
сообщение 25.12.2013 - 05:56
Сообщение #9





Группа: Пользователи
Сообщений: 7
Регистрация: 22.12.2013
Пользователь №: 25769



Исправила, где а-абсол величины, где н-номинальная шкала

Сообщение отредактировал Мотян - 25.12.2013 - 05:56
Прикрепленные файлы
Прикрепленный файл  книга.rar ( 31,76 килобайт ) Кол-во скачиваний: 306
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 25.12.2013 - 20:37
Сообщение #10





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Мотян @ 25.12.2013 - 05:56) *
Исправила, где а-абсол величины, где н-номинальная шкала


Версия анализа ? 1 (ещё надо досчитать оптимальные модели и построить для них ROC).
Прикрепленные файлы
Прикрепленный файл  otcet.pdf ( 318,37 килобайт ) Кол-во скачиваний: 346
 


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Мотян
сообщение 26.12.2013 - 18:34
Сообщение #11





Группа: Пользователи
Сообщений: 7
Регистрация: 22.12.2013
Пользователь №: 25769



Hи чего не поняла, прикрепленный файл посмотрела . Чем это считать? Извиняюсь за тупость, но не поняла
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 26.12.2013 - 20:06
Сообщение #12





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Мотян @ 26.12.2013 - 18:34) *
Hи чего не поняла, прикрепленный файл посмотрела . Чем это считать? Извиняюсь за тупость, но не поняла


Вы так говорите, как будто это что то плохое smile.gif Ничего считать собственно не надо, уже всё посчитано smile.gif Сейчас оптимальные модели и ROC для них досчитаю и выложу.

Вот собственно и посчитало.

Там для каждой модели список переменных-предикторов из двух частей (условно "достоверные" и "слабо достоверные"). Каждая из моделей показала AUC (в пределах доверительного интервала). Это и есть искомое что требовалось в топике, хотя в принципе можно и логистическую регрессию посчитать для углублённого изучения взаимодействия предикторов. Можно наоборот более точную модель родить оптимизируя svm по кроссошибке.

Как то так.

Сообщение отредактировал p2004r - 26.12.2013 - 22:17
Прикрепленные файлы
Прикрепленный файл  otcet.pdf ( 340,6 килобайт ) Кол-во скачиваний: 395
 


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Мотян
сообщение 9.01.2014 - 16:30
Сообщение #13





Группа: Пользователи
Сообщений: 7
Регистрация: 22.12.2013
Пользователь №: 25769



Огромное спасибо p2004r, сижу разбираюсь
Остался 1 вопрос чем это посчитано?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 10.01.2014 - 00:19
Сообщение #14





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Мотян @ 9.01.2014 - 16:30) *
Огромное спасибо p2004r, сижу разбираюсь
Остался 1 вопрос чем это посчитано?


Это R + knitr. Такая тенденция в современном исследовании когда всё исследование можно повторить в любой момент.

Про R можно читать http://cran.r-project.org/ Перевод Введения в R http://m7876.wiki.zoho.com/Introduction-to-R.html

Среда разработки http://www.rstudio.com/

TeX под винду не знаю какой лучше брать.

В архиве исходники проекта. По идее если на компьютере есть Rstudio, LaTeX, R то можно его дописывать и перегенерировать pdf
Прикрепленные файлы
Прикрепленный файл  archiv.rar ( 1,56 мегабайт ) Кол-во скачиваний: 304
 


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему