Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Методы исследования разнородных данных
Maria_
сообщение 14.12.2008 - 20:03
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 14.12.2008
Пользователь №: 5620



maria_lip48@mail.ruundefined
Здравствуйте!
Подскажите, пожалуйста, какой метод статистики применить к следующей задаче.
Имеется (зависимая) переменная у, которая принимает значения 1, 0 (да, нет) и зависит где-то от 25 разнотипных переменных - количественных и качественных. Необходимо выяснить, какие из этих переменных больше всего влияют на результирующую (выявить их значимость).
По идее, надо применять регрессионный анализ. Факторный тут не применить. Но можно ли, оперируя отдельно с у и количественными переменными, сократить их число (количественных переменных) с помощью факторного анализа, а в последующем исследовании использовать эти новые, сформированные с помощью ФА факторы, + все остальные переменные? Если что-то непонятно, уточните, может быть я изъясняюсь путано или где-то ошибаюсь.
p.s.: до этого у меня был опыт работы в statistica с временными рядами. Исследования планирую проводить в statistica.
Заранее спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 14.12.2008 - 23:21
Сообщение #2





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



А зачем везде фигурирует Y? Оставьте ее в покое. Для количественных предикторов с помощью компонентного анализа (PCA) получите новые обобщающие предикторы. Их, а также качественные предикторы используете в множественной логистической регрессии для выражения Y. Не очень изящно, но без ошибок. Более изящным представляется:
(1) получение обобщающих предикторов из всей совокупности данных кроме Y: как количественных, так и качественных. Этот путь требует применения специальных техник PCA. В любом случае, какой бы PCA не использовалcя, предполагается, что вы сумеете интерпретировать полученные компоненты по существу и дать им вразумительные обобщающие названия. На практике это получается не всегда и зависит от многих причин (опыт многомерного анализа, глубокое владение предметом исследования, наличие коррелирующих признаков в принципе, удачный набор признаков для анализа). Поэтому если вы непременно хотите использовать многомерные техники - будьте готовы углубиться в эту тему.
(2) ничего не обобщать, а использовать все имеющиеся признаки в регресии для Y. Можно с пошаговой техникой включения/исключения. В этом случае признаки, сильно коррелирующие с уже вошедшими в модель включаться в нее не будут, но обратной стороной неполного использования информации будет относительная простота модели.
То как вы планировали - сделать нельзя, т.к. в логистической регресии Y будет в обеих частях уравнения: в одной - в явном виде, в другой - в неявном - в какой-то компоненте.



Сообщение отредактировал nokh - 14.12.2008 - 23:58
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему