Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Линейная регрессия
Lordeg
сообщение 29.06.2017 - 12:09
Сообщение #1





Группа: Пользователи
Сообщений: 3
Регистрация: 29.06.2017
Пользователь №: 29989



Добрый день!
Возникли вопросы. help.gif, пожалуйста=)

Цель: Определить степень влияния факторов на мед. расходы.

Данные:
Предикторы - (пол, возраст, сем.положение и тд). Все категориальные. 7 шт
Зависимая - расходы на мед помощь (количественная)

Метод:
Предикторы были закодированы числами (в стиле муж-1/жен-2)
Проведена множественная линейная регрессия (обязательно МЛР, прихоть Нрук)
Закрыв глаза и стиснув зубы С радостью применил: lm(Y~x1+x2...), плюс посчитаны all-subsets regression (пакет leaps)

Вопросы:
1. Корректно ли вообще использовать линейную множественную регрессию для таких данных (категориальных). Интерпретация результатов пугает.
2. Науч. рук-ом было сказано: "Почему в модели регрессионного анализа в качестве предиктора, категориальная переменная без трансформации?" Скажите, как мне её трансформировать?
3. Науч. рук-ом было сказано: "И нужно осуществить регр. анализ методом backword elimination, а также построить модели регрессионного анализа поочередно, удаляя из них отдельно каждый предиктор." Зачем? all-subsets должен включаться в себя все варианты backword'а.
4. Что использовать, если не МЛР. Полно конечно всяких методов.

Заранее спасибо!
Простите, если уже обсуждалось это, не нашел.

Сообщение отредактировал Lordeg - 29.06.2017 - 14:44
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
p2004r
сообщение 29.06.2017 - 20:01
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Lordeg @ 29.06.2017 - 12:09) *
Добрый день!
Возникли вопросы. help.gif, пожалуйста=)

Цель: Определить степень влияния факторов на мед. расходы.

Данные:
Предикторы - (пол, возраст, сем.положение и тд). Все категориальные. 7 шт
Зависимая - расходы на мед помощь (количественная)

Метод:
Предикторы были закодированы числами (в стиле муж-1/жен-2)
Проведена множественная линейная регрессия (обязательно МЛР, прихоть Нрук)
Закрыв глаза и стиснув зубы С радостью применил: lm(Y~x1+x2...), плюс посчитаны all-subsets regression (пакет leaps)

Вопросы:
1. Корректно ли вообще использовать линейную множественную регрессию для таких данных (категориальных). Интерпретация результатов пугает.
2. Науч. рук-ом было сказано: "Почему в модели регрессионного анализа в качестве предиктора, категориальная переменная без трансформации?" Скажите, как мне её трансформировать?
3. Науч. рук-ом было сказано: "И нужно осуществить регр. анализ методом backword elimination, а также построить модели регрессионного анализа поочередно, удаляя из них отдельно каждый предиктор." Зачем? all-subsets должен включаться в себя все варианты backword'а.
4. Что использовать, если не МЛР. Полно конечно всяких методов.

Заранее спасибо!
Простите, если уже обсуждалось это, не нашел.



Использовать что то из https://en.wikipedia.org/wiki/Feature_extraction & https://en.wikipedia.org/wiki/Feature_selection

В гугле набрать "Feature selection site:r-project.org"


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Lordeg
сообщение 29.06.2017 - 22:08
Сообщение #3





Группа: Пользователи
Сообщений: 3
Регистрация: 29.06.2017
Пользователь №: 29989



Цитата(p2004r @ 29.06.2017 - 21:01) *
Использовать что то из https://en.wikipedia.org/wiki/Feature_extraction & https://en.wikipedia.org/wiki/Feature_selection

В гугле набрать "Feature selection site:r-project.org"


Спасибо!
Скажите, нет ли у Вас предположений. что может значить "трансформация категориальных переменных"? Как их трансформировать то??))
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему