![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 30.01.2008 Пользователь №: 4760 ![]() |
Коллеги, поделитесь опытом, есть ли смысл применять лог-линейный анализ в следующей ситуации:
переменная отклика бинарная: болен - здоров независимые предикторы: бинарные или порядковые (3-5 градаций), реже номинальные. Модели логистической регрессии выходят все очень низкодетерминированные, хоть и значимые, R^2 порядка 0,1-0,3. Правда это имеет и некоторое содержательное объяснение: речь идёт о заболеваемости разными группами заболеваний в зависимости от факторов образа жизни (анкетный материал). Часто в литературе рекомендуют применять именно логлинейный анализ для ситуаций, когда все данные качественные, в частности в социологии ( Толстова, Мирзоев). В нашей медицине его (логлин) реально кто-нибудь видел? Как описывать полученное, какими словами и т.п. Как ни крути, а логистическая регрессия в плане описания более удобна и понятна, вот и раздумываю, имеет ли смысл усложнять ситуацию. |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Ну вот, раз дела обстоят так, то по части регрессии от меня толку мало
![]() http://www2.chass.ncsu.edu/garson/pa765/logit.htm Там же описан неиерархический вариант анализа с зависимыми категорями, который возможно вам более подойдет, но я им не пользовался. Это вообще хороший ресурс (http://www2.chass.ncsu.edu/garson/pa765/statnote.htm), все четко по полочкам разложено. Что касается MCA, то действительно он в SPSS не на виду. Эта техника многократно и независимо открывалась и имеет разные названия. В SPSS это - Homogeneity analysis. В деталях он может отличаться от других алгоритмов MCA, но в принципе - то же самое. Он, как и CATPCA находится в модуле Data reduction - Optimal scaling (есть даже в версии 10.0). Там если выбрать что все переменные номинальные - будет Homogeneity analysis, иначе - CATPCA. В последней есть возможность тонкой настройки типа данных и способа дискретизатии. Я обычно для количественных данных выбираю numeric, а в качестве дискретизации - ранжирование. Для номинальных категорий - nominal, а дискретизацию не заполняю (Unspesified). Читал, что для порядковых переменных лучше выбирать Spline ordinal: реальные расстояния между упорядоченными категориями могут быть разными и алгоритм сам как-то это вычисляет, потом можно посмотреть. С практической точки зрения есть сложность с выбором числа компонент (здесь в отличие от классического PCA его нужно четко задать, как в факторном): если много номинальных категорий и/или слабая связь между переменными Scree plot (нужно строить самому) получается без выраженных изломов. Делаю так: (1) сначала задаю все компоненты, т.е. сколько переменных, (2) строю Scree plot и определяюсь с числом компонент, (3) в новом анализе выставляю это число и сохраняю преобразованные переменные (в менюшке Save нужно отметить), (4) в модуле классического PCA задаю то же число компонент и выполняю PCA с варимакс-вращением для преобразованных переменных, (5) в матрице нагрузок выделяю жирным значения более 0,3 и интерпретирую компоненты, (6) сохраняю шкалы, чтобы потом с ними работать или строить biplot средствами более удобных в работе с графикой программ. Схему придумал не сам - вычитал у зарубежных психологов в статье. Эти ухищрения нужны чтобы выполнить вращение, которое улучшает интерпретируемость, но отсутствует в модуле CATPCA. Хоть это и разведочный анализ, результаты обычно не разочаровывают: интересные и логичные интерпретации выходят. Попробуйте! И последнее. Многие вопросы по SPSS можно задать в сообществе: http://community.livejournal.com/ru_spss/ |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 30.01.2008 Пользователь №: 4760 ![]() |
Разные виды моделей (анализов, подходов). Не спорю, может регрессионная модель и окажется наиболее толковой. Но почему бы не попробовать и другие подходы? Благо времени и сил это нынче не очень много занимает. Не на калькуляторе же вручную считаем, как когда-то давным-давно . . .
Ресурс посмотрела. Хороший. Спасибо. Вообще я многие вещи изучала по подобным сайтам западных универов. Уровень сложности и подробности изложения можно любой найти. CATPCA -- посмотрела. Всё работает! Спасибо. Scree plot, понятно, что и в экселе строиться. А вот идея сохранить преобразованные переменные и по ним отдельно вращать -- красивая. С ходу не догадаешься. Я пока бегло посмотрела, по переменным, где содержательные интерпретации очевидные. Надо ещё будет поэкспериментировать с настройками ( у меня чуток иначе пошло: дискретизация не Unspesified, а RANKING), сравнить с картинкой по тем же переменным из Статистики, и подчитать еще ( последенее процесс бесконечный). . . |
|
![]() |
![]() |
![]() ![]() |