![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 30.01.2008 Пользователь №: 4760 ![]() |
Коллеги, поделитесь опытом, есть ли смысл применять лог-линейный анализ в следующей ситуации:
переменная отклика бинарная: болен - здоров независимые предикторы: бинарные или порядковые (3-5 градаций), реже номинальные. Модели логистической регрессии выходят все очень низкодетерминированные, хоть и значимые, R^2 порядка 0,1-0,3. Правда это имеет и некоторое содержательное объяснение: речь идёт о заболеваемости разными группами заболеваний в зависимости от факторов образа жизни (анкетный материал). Часто в литературе рекомендуют применять именно логлинейный анализ для ситуаций, когда все данные качественные, в частности в социологии ( Толстова, Мирзоев). В нашей медицине его (логлин) реально кто-нибудь видел? Как описывать полученное, какими словами и т.п. Как ни крути, а логистическая регрессия в плане описания более удобна и понятна, вот и раздумываю, имеет ли смысл усложнять ситуацию. |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Как только было написано, что есть переменная отклика - это практически автоматом означает, что необходим регресионный метод анализа. Оптимальный вариант в данном случае - логистическая регрессия с превращением порядковых переменных в переменные-пустышки (dummy. Логистическая регрессия не очень хорошо приспособлена для ординальных независимых переменных). Что касается логлинейного анализа - то он хорош для определения связей между переменными, однако в логлинейном анализе надо крайне аккуратно относится к автоматическому выбору моделей, чаще всего необходимо подбирать наиболее адекватную модель вручную путем построения всего набора вложенных моделей.
Насчет же варимакс вращения после PCA качественных переменных - что-то странное. Метод максимизирует дисперсию (весь факторный анализ параметрический) - и тут у нас мгновенно идет нарушение допущения гомоскедаксичности. Мне кажется, вращение не зря убрали из CATPCA - что касается того, что идея почерпнута в публикации - не забывайте, что в среднем в западных публикациях примерно 50% содержат статистические ошибки. Если уже действительно надо делать аналог факторного анализа для качественных переменных - корреспондентский анализ именно для этого и разрабатывался, проблема с многоуровневыми переменными решается так же, как и в случае логистической регрессии |
|
![]() |
![]() |
![]() ![]() |