![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 30.01.2008 Пользователь №: 4760 ![]() |
Коллеги, поделитесь опытом, есть ли смысл применять лог-линейный анализ в следующей ситуации:
переменная отклика бинарная: болен - здоров независимые предикторы: бинарные или порядковые (3-5 градаций), реже номинальные. Модели логистической регрессии выходят все очень низкодетерминированные, хоть и значимые, R^2 порядка 0,1-0,3. Правда это имеет и некоторое содержательное объяснение: речь идёт о заболеваемости разными группами заболеваний в зависимости от факторов образа жизни (анкетный материал). Часто в литературе рекомендуют применять именно логлинейный анализ для ситуаций, когда все данные качественные, в частности в социологии ( Толстова, Мирзоев). В нашей медицине его (логлин) реально кто-нибудь видел? Как описывать полученное, какими словами и т.п. Как ни крути, а логистическая регрессия в плане описания более удобна и понятна, вот и раздумываю, имеет ли смысл усложнять ситуацию. |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
В вашей ситуации логлинейный анализ вряд ли подойдет. Не исключено, что может повезти и сработает какое-то взаимодействие входов таблицы, но скорее добавление в анализ новых переменных сделает картину еще более размытой. Статистика "размажется" по огромному числу взаимодействий, а число степеней свободы будет очень велико. С логистической регрессией я работаю редко, поэтому не могу подсказать точно где это сделать, но должны быть программы с алгоритмами автоматического выбора лучшей модели для множественной логистической регрессии. Это первый вариант. Другой вариант - попробовать вытащить из связей предикторов латентные обобщающие переменные, возможно они окажутся более сильными предикторами + удастся обобщить данные. В качестве таких переменных можно использовать шкалы, полученные в ходе множественного анализа соответствий (multiple correspondence analysis) или других ординационных текхник. В SPSS, например, есть алгоритм Categorical PCA, позволяющий обрабатывать одновременно количественные, порядковые и качественные переменные. Этот путь требует специфической практики многомерного анализа данных.
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 30.01.2008 Пользователь №: 4760 ![]() |
Спасибо за участие к моим проблемам! Отвечаю и раздумываю по порядку. Экспериментирую с логлинейным анализом с ограниченным набором переменных ( по 4 шт, где по другим методам анализа или по здравому смыслу вероятны взаимодействия). Это чтоб не «размазалась» статистика. Да и объём наблюдений, как водится в медицине не тысячи, а сотни. И кое-где значимые взаимодействия 3х переменных, типа var1*var2*var3 выходят. Но я задаю кросс-переменные и в логистической регрессии. И они иногда в модель включаются. Не всегда вот взаимодействия, полученные этими двумя методами исследования, совпадают.
Логистическая регрессия. С автоматическим выбором предикторов нет проблем. И вообще проблема не с получением модели (я их часто делаю, да и в западных статьях это достаточно популярный метод), а с её качеством. Чтоб не быть голословной привожу синтаксис ( я в SPSS работаю; пусть var1 -- зависимая переменная, остальные -- независимые). LOGISTIC REGRESSION VAR= var1 /METHOD=FSTEP(WALD) var2 var3 var4 var2 * var3 var4 *var2 var3 * var4 /PRINT=CI(95) /CRITERIA PIN(.05) POUT(.10) ITERATE(20) CUT(.5) . fstep и дает пошаговый отбор с включением, и наоборот можно bstep; по обстоятельствам смотрю. Логлинейный анализ с тем же набором переменных: HILOGLINEAR var1(0 1) var2(0 1) var3(0 1) var4(0 1) /METHOD=BACKWARD /CRITERIA MAXSTEPS(10) P(.05) ITERATION(20) DELTA(.5) /PRINT=FREQ RESID /DESIGN . Но! если описывая логистическую регрессию можно привести exp(b), интерпретируемое как ОШ, то от логлинейного анализа мы можем указать в текстовом отчете только что выявили значимые взаимодействия таких-то предикторов и всё. Или я чего-то недооцениваю? Ползём дальше. Multiple correspondence analysis. В множественном варианте он у меня только в Statistica идёт. В SPSS (более любимым мною) -- только с двумя переменными. И в данном исследовании анализ соответствий (с двумя переменными по 5-7 градаций) давал некоторые интересные визуализации. Честно говоря, я его ( и двумерный и многомерный) вообще применяю только как разведочный анализ и или способ визуализации и не более. Это сторона интерпретаций. А в техническом плане (для MCA), может, у меня версия SPSS старовата? Судя по их инфoрмации на сайте spss.ru, оно так и есть -- рекламируют MCA для 14 версии. . . Я 11.5 использую, т.к. по жизни консерватор, ни за что не перехожу ни на что новое, пока не убеждаюсь, что из старого совсем уж выросла и что имеющееся новое не совсем уж дрянь. Впрочем, у меня есть и 15 версия, немного тестировала я её, но она стоит на стареньком компе, где в данный момент монитор глючит (то мои временные трудности). Или может как-то в обход можно из синтаксиса выудить multiple correspondence analysis ( типа на одном этапе сохранив burt matrix, а на следующем собственно анализ проведя)? Если да, буду весьма благодарна подсказке. И Categorical PCA, я так понимаю, в более поздних версиях реализован. . . Плюс надо осознать, что за ним стоит.. . Я как раз ( в отличие, видимо, от nokh) компонентный анализ и в классическом-то варианте нечасто применяю . . . |
|
![]() |
![]() |
![]() ![]() |