![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 14.12.2008 Пользователь №: 5620 ![]() |
maria_lip48@mail.ruundefined
Здравствуйте! Подскажите, пожалуйста, какой метод статистики применить к следующей задаче. Имеется (зависимая) переменная у, которая принимает значения 1, 0 (да, нет) и зависит где-то от 25 разнотипных переменных - количественных и качественных. Необходимо выяснить, какие из этих переменных больше всего влияют на результирующую (выявить их значимость). По идее, надо применять регрессионный анализ. Факторный тут не применить. Но можно ли, оперируя отдельно с у и количественными переменными, сократить их число (количественных переменных) с помощью факторного анализа, а в последующем исследовании использовать эти новые, сформированные с помощью ФА факторы, + все остальные переменные? Если что-то непонятно, уточните, может быть я изъясняюсь путано или где-то ошибаюсь. p.s.: до этого у меня был опыт работы в statistica с временными рядами. Исследования планирую проводить в statistica. Заранее спасибо. |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
А зачем везде фигурирует Y? Оставьте ее в покое. Для количественных предикторов с помощью компонентного анализа (PCA) получите новые обобщающие предикторы. Их, а также качественные предикторы используете в множественной логистической регрессии для выражения Y. Не очень изящно, но без ошибок. Более изящным представляется:
(1) получение обобщающих предикторов из всей совокупности данных кроме Y: как количественных, так и качественных. Этот путь требует применения специальных техник PCA. В любом случае, какой бы PCA не использовалcя, предполагается, что вы сумеете интерпретировать полученные компоненты по существу и дать им вразумительные обобщающие названия. На практике это получается не всегда и зависит от многих причин (опыт многомерного анализа, глубокое владение предметом исследования, наличие коррелирующих признаков в принципе, удачный набор признаков для анализа). Поэтому если вы непременно хотите использовать многомерные техники - будьте готовы углубиться в эту тему. (2) ничего не обобщать, а использовать все имеющиеся признаки в регресии для Y. Можно с пошаговой техникой включения/исключения. В этом случае признаки, сильно коррелирующие с уже вошедшими в модель включаться в нее не будут, но обратной стороной неполного использования информации будет относительная простота модели. То как вы планировали - сделать нельзя, т.к. в логистической регресии Y будет в обеих частях уравнения: в одной - в явном виде, в другой - в неявном - в какой-то компоненте. Сообщение отредактировал nokh - 14.12.2008 - 23:58 |
|
![]() |
![]() |
![]() ![]() |