Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Логлинейный анализ, есть ли смысл
marinakom
сообщение 30.01.2008 - 11:31
Сообщение #1





Группа: Пользователи
Сообщений: 7
Регистрация: 30.01.2008
Пользователь №: 4760



Коллеги, поделитесь опытом, есть ли смысл применять лог-линейный анализ в следующей ситуации:
переменная отклика бинарная: болен - здоров
независимые предикторы: бинарные или порядковые (3-5 градаций), реже номинальные.
Модели логистической регрессии выходят все очень низкодетерминированные, хоть и значимые, R^2 порядка 0,1-0,3. Правда это имеет и некоторое содержательное объяснение: речь идёт о заболеваемости разными группами заболеваний в зависимости от факторов образа жизни (анкетный материал). Часто в литературе рекомендуют применять именно логлинейный анализ для ситуаций, когда все данные качественные, в частности в социологии ( Толстова, Мирзоев). В нашей медицине его (логлин) реально кто-нибудь видел? Как описывать полученное, какими словами и т.п. Как ни крути, а логистическая регрессия в плане описания более удобна и понятна, вот и раздумываю, имеет ли смысл усложнять ситуацию.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
плав
сообщение 6.02.2008 - 13:27
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Игорь @ 6.02.2008 - 09:35) *
Насчет 70-х годов - не знаю, работ не встречал (если кто знает названия, просьба поделиться). Так что не исключено, что идея факторного анализа произвольных (качественных и количественных), в том числе смешанных, данных, принадлежит д.м.н. В.А. Уткину.


Методика факторного анализа качественных (бинарных) переменных была разработана еще в Kelly в 50х годах (для анализа репертуарных решеток), а идея совместного анализа качественных и количественных переменных описана, например, в
Jahn, W, Vahle H. Die Faktorenanalyse. Verlag die Wirtschaft, Berlin, 1970. Поскольку это обзорная прикладная книга, сама методика явно появилась еще раньше. Книга продавалась в СССР и, с моей точки зрения, является одним из лучших введений в факторный анализ (я с ее помощью делал факторный анализ с помощью калькулятора - там были методики "ручного расчета").

Цитата(marinakom @ 6.02.2008 - 11:11) *
По поводу квази-решения, предложенного Плав`ом. Хоть SPSS более популярен у маркетологов и социологов, чем у медиков, вот ссылка синтаксиса для SPSS, где реализована идея факторного анализа по корреляциям Спирмена.
http://www.spsstools.ru/Syntax/FA/FAwithSp...Correlation.txt
Там довольно своеобразный файл матрицы для факторного анализа конструируется, в котором первые три строки (cases) среднее, SD, N по каждой переменной, далее попарные корреляции по каждой переменной ( Спирмена или Кендалла, какие заявить; можно и другие меры связи засунуть). А что за специальные множители, г-н Плав, можно пояснить (хотя бы на уровне ключевых слов)?

Подобные матрицы формируются потому, что именно такой формат данных является входным для факторного анализа в этих программах (аналогичный формат и в SAS), хотя, строго говоря, нужна только матрица корреляций. Проблема в том, что если взять нормально распределенные данные и рассчитать коэффициент корреляции Пирсона (обычный) и Спирмена, то их значения будут различными. Для коррекции используются множители, которые можно найти в Математической энциклопедии. Формулы для коэффициентов Кэнделла (тау) и Спирмена (rho_s) выглядят так:
rho=sin((pi/2)*tau)=2*sin((pi/6)*rho_s) (http://www.statacorp.com/statalist/archive/2002-09/msg00000.html)
Для бинарных переменных используется тетрахорический коэффициент корреляции Пирсона
rho=cos(pi*sqrt(B*C)/(sqrt(BC)+sqrt(AD)) (см. ссылку на книгу Jahn и Vahle выше), считается, что он примерно равен коэффициенту Пирсона (product-moment) при медианом делении распределения для бинаризации.
интересное обсуждение разных вариантов категоризации переменных для PCA на основе вычислительного эксперимента представлены С.Колениковым (http://www.unc.edu/~skolenik/talks/StatLunch/statlunch-kolenikov-030304.pdf). Не призываю ему "верить", но посмотрите, какой подход используется если надо сравнивать разные методы.

Цитата(Игорь @ 6.02.2008 - 09:35) *
Сначала персоналии:
Marica Manisera - аспирантка http://www.unibs.it/on-line/dmq/Home/Perso.../scheda913.html
Elise Dusseldorp - PhD, преподаватель http://www.datatheory.nl/pages/dusseldorp.html
Anita van der Kooij - PhD, разработчик SPSS http://www.datatheory.nl/pages/kooij.html
Групповое фото http://www.datatheory.nl/pages/staff.html
Два последних автора - авторитетные ученые в данной области. Но работа исследовательская. Не опубликована. Ссылаться нельзя. Рекомендуется подождать публикации.

Ой не люблю я проходиться по персоналиям, но ничего не могу поделать, не я начал:
SPSS была разработана в конце 1960х годов в Университете Чикаго, соответственно, Anita van der Kooij никак не может быть ее "разработчиком", она принимала участие в разработке программного обеспечения для одного из модулей (который, кстати, разрабатывался ее консультантами по кандидатской (PhD) диссертации, защищенной в 2007 году по психологии - не по биостатистике). В списке литературы статей в рецензируемых журналах я не нашел - только статьи в сборниках и документы- описания алгоритмов.
Elise Dusseldorp также была учеником Meulman, под руководством которого защитила диссертацию в 2001. Большинство опубликованных работ в рецензируемых журналах посвящены психологии. Две статьи можно отнести к работам в области биостатистики - одна в журнале Psychometrica, другая - в Methods of Information in Medicine. Второй журнал не с самым высоким импакт-фактором.
Иными словами, речь идет о молодых ученых, которые, вполне возможно, абсолютно правы в своих подходах, но ссылаться на их авторитет как на непререкаемый я бы не рекомендовал. Честно говоря, я бы не рекомендовал бездумно использовать и получаемые на этом форуме рекомендации - будь то мои, Игоря или еще кого иного. Наука не базируется на авторитетах, она базируется на фактах и логике. Иными словами, все, что я написал выше об ответственности исследователя за использованный метод остается в силе.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- marinakom   Логлинейный анализ   30.01.2008 - 11:31
- - nokh   В вашей ситуации логлинейный анализ вряд ли подойд...   31.01.2008 - 17:21
|- - marinakom   Спасибо за участие к моим проблемам! Отвечаю и...   1.02.2008 - 00:10
- - nokh   Ну вот, раз дела обстоят так, то по части регресси...   1.02.2008 - 22:33
|- - marinakom   Разные виды моделей (анализов, подходов). Не спор...   2.02.2008 - 01:12
- - плав   Как только было написано, что есть переменная откл...   5.02.2008 - 18:39
- - nokh   В свое время читал, что вращения - это для факторн...   5.02.2008 - 23:06
- - плав   Вопрос веры - это вопрос, который не обсуждается. ...   6.02.2008 - 01:56
|- - marinakom   Господа! Наша дискуссия разделилась на две вет...   6.02.2008 - 11:11
- - Игорь   Цитата(nokh @ 5.02.2008 - 23:06) В с...   6.02.2008 - 09:35
|- - nokh   Цитата(Игорь @ 6.02.2008 - 12:35) Сн...   10.06.2010 - 22:46
- - плав   Цитата(Игорь @ 6.02.2008 - 09:35) На...   6.02.2008 - 13:27
- - Игорь   Цитата(плав @ 6.02.2008 - 01:56) В п...   13.02.2008 - 12:19
|- - плав   Цитата(Игорь @ 13.02.2008 - 12:19) П...   13.02.2008 - 16:39
- - Игорь   Цитата(плав @ 13.02.2008 - 16:39) А ...   14.02.2008 - 13:52
- - плав   Цитата(Игорь @ 14.02.2008 - 13:52) Н...   15.02.2008 - 13:44


Добавить ответ в эту темуОткрыть тему