![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 14.12.2008 Пользователь №: 5620 ![]() |
maria_lip48@mail.ruundefined
Здравствуйте! Подскажите, пожалуйста, какой метод статистики применить к следующей задаче. Имеется (зависимая) переменная у, которая принимает значения 1, 0 (да, нет) и зависит где-то от 25 разнотипных переменных - количественных и качественных. Необходимо выяснить, какие из этих переменных больше всего влияют на результирующую (выявить их значимость). По идее, надо применять регрессионный анализ. Факторный тут не применить. Но можно ли, оперируя отдельно с у и количественными переменными, сократить их число (количественных переменных) с помощью факторного анализа, а в последующем исследовании использовать эти новые, сформированные с помощью ФА факторы, + все остальные переменные? Если что-то непонятно, уточните, может быть я изъясняюсь путано или где-то ошибаюсь. p.s.: до этого у меня был опыт работы в statistica с временными рядами. Исследования планирую проводить в statistica. Заранее спасибо. |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Задача логистической регрессии.
Для снижения количества независимых переменых можно использовать факторный анализ (точнее анализ главных компонент), но он работает для количественных переменных (с линейной связью). |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 14.12.2008 Пользователь №: 5620 ![]() |
Задача логистической регрессии. Для снижения количества независимых переменых можно использовать факторный анализ (точнее анализ главных компонент), но он работает для количественных переменных (с линейной связью). А каковы особенности логистической регресии по сравнению с обычной множественной? |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 14.12.2008 Пользователь №: 5620 ![]() |
Объясню по пунктам, наверное в первый раз не совсем понятно изложила проблему
![]() Можно ли сделать так: п.1. Взять у и количественные переменные и применить к ним анализ главных компонент, тем самым сократив число количественных переменных, заменив несколько одной. В результате этого этапа получим новые факторы (переменные), которые в действительности являются линейной комбинацией нескольких исходных переменных. п.2. Взять у и новые переменные, а также не бравшиеся в рассмотрение в п.1. качественные переменные и применить уже к этой совокупности регрессионный анализ (как Вы отметили, логистический). Или же это брэд? ![]() |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
А зачем везде фигурирует Y? Оставьте ее в покое. Для количественных предикторов с помощью компонентного анализа (PCA) получите новые обобщающие предикторы. Их, а также качественные предикторы используете в множественной логистической регрессии для выражения Y. Не очень изящно, но без ошибок. Более изящным представляется:
(1) получение обобщающих предикторов из всей совокупности данных кроме Y: как количественных, так и качественных. Этот путь требует применения специальных техник PCA. В любом случае, какой бы PCA не использовалcя, предполагается, что вы сумеете интерпретировать полученные компоненты по существу и дать им вразумительные обобщающие названия. На практике это получается не всегда и зависит от многих причин (опыт многомерного анализа, глубокое владение предметом исследования, наличие коррелирующих признаков в принципе, удачный набор признаков для анализа). Поэтому если вы непременно хотите использовать многомерные техники - будьте готовы углубиться в эту тему. (2) ничего не обобщать, а использовать все имеющиеся признаки в регресии для Y. Можно с пошаговой техникой включения/исключения. В этом случае признаки, сильно коррелирующие с уже вошедшими в модель включаться в нее не будут, но обратной стороной неполного использования информации будет относительная простота модели. То как вы планировали - сделать нельзя, т.к. в логистической регресии Y будет в обеих частях уравнения: в одной - в явном виде, в другой - в неявном - в какой-то компоненте. Сообщение отредактировал nokh - 14.12.2008 - 23:58 |
|
![]() |
![]() |
![]()
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 14.12.2008 Пользователь №: 5620 ![]() |
А зачем везде фигурирует Y? Оставьте ее в покое. Для количественных предикторов с помощью компонентного анализа получите новые обобщающие предикторы. Их, а также качественные предикторы используете в множественной логистической регрессии для выражения Y. Не очень изящно, но без ошибок. Y фигурирует т.к. Y писать короче, чем "зависимая переменная" ![]() Не могли бы вы подсказать, реализованы ли эти методы в системе Statistica. Спрашиваю, потому, что использовала всегда только ее. Если нет, то, может быть вы знаете, где они реализованы. Данных много, без специальных средств вычислений не обойтись. А еще, какая есть полезная литература по данным вопросам? |
|
![]() |
![]() |
![]()
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
В Statistic'е есть. Кратко описано (стр. 221) в книге: Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. - М.: МедиаСфера, 2002. 312 с. (встечается в и-нете в формате djvu). Также в и-нете много материала.
|
|
![]() |
![]() |
![]()
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 381 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 ![]() |
Если нет, то, может быть вы знаете, где они реализованы. А еще, какая есть полезная литература по данным вопросам? Для логистической регрессии лучше использовать SPSS, чем STATISTICA. Там понятнее и результат выводится на одном листе.Литература, в которой описывается логистическая регрессия и которую можно скачать из интернета: 1. Petrie A., Sabin C. "Medical Statistics at a Glance" (есть русский перевод) 2. Таганов "SPSS: Статистический анализ в маркетинговых исследованиях" 3. Бююль "SPSS: искусство обработки информации " Сообщение отредактировал DoctorStat - 15.12.2008 - 12:44 ![]() Просто включи мозги => http://doctorstat.narod.ru
|
|
![]() |
![]() |
![]() ![]() |