Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Методы исследования разнородных данных
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Maria_
maria_lip48@mail.ruundefined
Здравствуйте!
Подскажите, пожалуйста, какой метод статистики применить к следующей задаче.
Имеется (зависимая) переменная у, которая принимает значения 1, 0 (да, нет) и зависит где-то от 25 разнотипных переменных - количественных и качественных. Необходимо выяснить, какие из этих переменных больше всего влияют на результирующую (выявить их значимость).
По идее, надо применять регрессионный анализ. Факторный тут не применить. Но можно ли, оперируя отдельно с у и количественными переменными, сократить их число (количественных переменных) с помощью факторного анализа, а в последующем исследовании использовать эти новые, сформированные с помощью ФА факторы, + все остальные переменные? Если что-то непонятно, уточните, может быть я изъясняюсь путано или где-то ошибаюсь.
p.s.: до этого у меня был опыт работы в statistica с временными рядами. Исследования планирую проводить в statistica.
Заранее спасибо.
плав
Задача логистической регрессии.
Для снижения количества независимых переменых можно использовать факторный анализ (точнее анализ главных компонент), но он работает для количественных переменных (с линейной связью).
Maria_
Цитата(плав @ 14.12.2008 - 20:33) *
Задача логистической регрессии.
Для снижения количества независимых переменых можно использовать факторный анализ (точнее анализ главных компонент), но он работает для количественных переменных (с линейной связью).

А каковы особенности логистической регресии по сравнению с обычной множественной?
Maria_
Объясню по пунктам, наверное в первый раз не совсем понятно изложила проблему smile.gif .
Можно ли сделать так:
п.1. Взять у и количественные переменные и применить к ним анализ главных компонент, тем самым сократив число количественных переменных, заменив несколько одной.
В результате этого этапа получим новые факторы (переменные), которые в действительности являются линейной комбинацией нескольких исходных переменных.
п.2. Взять у и новые переменные, а также не бравшиеся в рассмотрение в п.1. качественные переменные и применить уже к этой совокупности регрессионный анализ (как Вы отметили, логистический).

Или же это брэд? smile.gif
nokh
А зачем везде фигурирует Y? Оставьте ее в покое. Для количественных предикторов с помощью компонентного анализа (PCA) получите новые обобщающие предикторы. Их, а также качественные предикторы используете в множественной логистической регрессии для выражения Y. Не очень изящно, но без ошибок. Более изящным представляется:
(1) получение обобщающих предикторов из всей совокупности данных кроме Y: как количественных, так и качественных. Этот путь требует применения специальных техник PCA. В любом случае, какой бы PCA не использовалcя, предполагается, что вы сумеете интерпретировать полученные компоненты по существу и дать им вразумительные обобщающие названия. На практике это получается не всегда и зависит от многих причин (опыт многомерного анализа, глубокое владение предметом исследования, наличие коррелирующих признаков в принципе, удачный набор признаков для анализа). Поэтому если вы непременно хотите использовать многомерные техники - будьте готовы углубиться в эту тему.
(2) ничего не обобщать, а использовать все имеющиеся признаки в регресии для Y. Можно с пошаговой техникой включения/исключения. В этом случае признаки, сильно коррелирующие с уже вошедшими в модель включаться в нее не будут, но обратной стороной неполного использования информации будет относительная простота модели.
То как вы планировали - сделать нельзя, т.к. в логистической регресии Y будет в обеих частях уравнения: в одной - в явном виде, в другой - в неявном - в какой-то компоненте.

Maria_
Цитата(nokh @ 14.12.2008 - 23:21) *
А зачем везде фигурирует Y? Оставьте ее в покое. Для количественных предикторов с помощью компонентного анализа получите новые обобщающие предикторы. Их, а также качественные предикторы используете в множественной логистической регрессии для выражения Y. Не очень изящно, но без ошибок.


Y фигурирует т.к. Y писать короче, чем "зависимая переменная" smile.gif . Большое спасибо за ценный совет. Никогда раньше не слышала про множественную логистическую регрессию, наверное потому, что не интересовалась применением статистики к медицине, но оказывается этот аппарат очень полезен в построении моделей в медицине и проведении клинических исследований.
Не могли бы вы подсказать, реализованы ли эти методы в системе Statistica. Спрашиваю, потому, что использовала всегда только ее. Если нет, то, может быть вы знаете, где они реализованы. Данных много, без специальных средств вычислений не обойтись.
А еще, какая есть полезная литература по данным вопросам?
nokh
В Statistic'е есть. Кратко описано (стр. 221) в книге: Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. - М.: МедиаСфера, 2002. 312 с. (встечается в и-нете в формате djvu). Также в и-нете много материала.
DoctorStat
Цитата(Maria_ @ 14.12.2008 - 23:59) *
Если нет, то, может быть вы знаете, где они реализованы. А еще, какая есть полезная литература по данным вопросам?
Для логистической регрессии лучше использовать SPSS, чем STATISTICA. Там понятнее и результат выводится на одном листе.
Литература, в которой описывается логистическая регрессия и которую можно скачать из интернета:
1. Petrie A., Sabin C. "Medical Statistics at a Glance" (есть русский перевод)
2. Таганов "SPSS: Статистический анализ в маркетинговых исследованиях"
3. Бююль "SPSS: искусство обработки информации "
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.