Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Логлинейный анализ, есть ли смысл
marinakom
сообщение 30.01.2008 - 11:31
Сообщение #1





Группа: Пользователи
Сообщений: 7
Регистрация: 30.01.2008
Пользователь №: 4760



Коллеги, поделитесь опытом, есть ли смысл применять лог-линейный анализ в следующей ситуации:
переменная отклика бинарная: болен - здоров
независимые предикторы: бинарные или порядковые (3-5 градаций), реже номинальные.
Модели логистической регрессии выходят все очень низкодетерминированные, хоть и значимые, R^2 порядка 0,1-0,3. Правда это имеет и некоторое содержательное объяснение: речь идёт о заболеваемости разными группами заболеваний в зависимости от факторов образа жизни (анкетный материал). Часто в литературе рекомендуют применять именно логлинейный анализ для ситуаций, когда все данные качественные, в частности в социологии ( Толстова, Мирзоев). В нашей медицине его (логлин) реально кто-нибудь видел? Как описывать полученное, какими словами и т.п. Как ни крути, а логистическая регрессия в плане описания более удобна и понятна, вот и раздумываю, имеет ли смысл усложнять ситуацию.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
плав
сообщение 6.02.2008 - 01:56
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Вопрос веры - это вопрос, который не обсуждается.
Для всех остальных
1) Не понятно, где она была опубликована и была ли опубликована вообще (приведенная ссылка - это черновик статьи, см. заметки для авторов в литературе) - была ли эта статья рецензирована?
2) Кафедра педагогики Лейденского университета вряд ли может быть описана как "математическое отделение университета", хотя в числе авторов есть одна, которая также была соавтором работ с создателями программы CATPCA
3) Непонятно, почему нет обычного в таких случаях математического обоснования разработанной методики или - что принято в биостатистике - результатов вычислительного эксперимента. В таком случае подход был бы более оправданным
3) Обоснования использования метода вращения в статье нет
4) "В противоположность номинальным или ординальным переменным в анализе, трансформированные переменные имеют метрические свойства" (стр. 6) - иными словами, магическое преобразование и над полом (людей) можно совершать математические операции сложения и вычитания, а также объяснять чему равен пол 1,5.
Сказанное выше не означает, что использованный подход неправильный (или правильный), а лишь, то что остается ряд вопросов, которые должен задавать себе любой человек, пытающийся использовать нестандартные подходы к анализу данных. Общее правило сохраняется - если кто-то готов, что ему зададут вопросы почему он делал так, а не иначе, и он сможет на них _обоснованно_ ответить, а не сослаться на авторитеты, то подобный подход он использовать может. Если же на вопрос - "почему так?" идет ссылка на Ивана Ивановича (Джона Смита), то оппоненты могут усомниться в способности автора правильно выбирать и использовать методы (ибо всегда можно найти 333 отличия между опубликованной пусть даже в рецензируемом журнале статьей и описываемой задачей).
В принципе, есть вообще очень простой способ анализировать факторным анализом любые данные - делаете корреляции, корректируете их так, чтобы они были сопоставимы с Пирсоновским коэффициентом корреляции (т.е. для бинарных используете тетрахорический коэффициент корреляции, для качественных/количественных - точечно-бисериальный, для упорядоченных Спирмена - только затем их домножаете на специальные множители - их можно найти во многих математических справочниках). После этого корреляционную решетку анализируете как в обычном случае (со всеми вращениями и т.п.). Это, конечно, квази решение, но концептуально проще и используется, как минимум, с начала 1970х годов (т.е. когда CATPCA не было и в помине). И, самое главное, всегда можно объяснить что и как делалось (я подозреваю, что идеи в описанной выше статье близки к этому старому подходу, судя по замечанию 4)


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
marinakom
сообщение 6.02.2008 - 11:11
Сообщение #3





Группа: Пользователи
Сообщений: 7
Регистрация: 30.01.2008
Пользователь №: 4760



Господа! Наша дискуссия разделилась на две ветви. По первой части, непосредственно озвученной мною в первом сообщении ( логистическая регрессия и логлинейный анализа для изучения зависимости заболеваемости студентов от факторов образа жизни) я получила полезную ссылку +, судя по недавнему сообщению Плав`а, подтверждение моей гипотезы, что логлинейный анализ хорош именно для выявления связей между переменными. Особенно удачно в моем примере выходит, когда в эту связку, выявленную логлинейным анализом, попадает переменная, бывшая зависимой в модели логистической регрессии. Для выбора окончательной модели (при любом способе моделирования) всё равно необходим здравый смысл и содержательная оценка получаемых результатов. Так что вроде по этим двум методам непротиворечивые, взаимодополняющие результаты выходят.
Второе направление дискуссии -- разные варианты факторного анализа и близкие к нему методы мне менее знакомы. На данный момент для меня осталось загадкой, как происходят преобразования шкал (из 0 и 1 в моем случае, в какие дробные числа) в методе CatPCA. Однако ж, что не менее удивительно, процент объясненной дисперсии по двум новоиспечённым осям в методе CatPCA в SPSS и многомерном корреспондентском анализе в Statistica с одни и тем же набором переменных совпали один в один, хотя MCA основан на мере хи-квадрат ( логичной для таблиц сопряженности). На ближайшую неделю-другую вынуждена отложить эти эксперименты: никуда не денешься, приходится расставлять приоритеты в своих работах и увлечениях. После многих лет работы в практическом здравоохранении я попала в технический вуз, где достаточно строго относятся к математическим идеям и высказываниям, поэтому и вникать хочу основательно, а не только на пакетно-пользовательском уровне.
По поводу квази-решения, предложенного Плав`ом. Хоть SPSS более популярен у маркетологов и социологов, чем у медиков, вот ссылка синтаксиса для SPSS, где реализована идея факторного анализа по корреляциям Спирмена.
http://www.spsstools.ru/Syntax/FA/FAwithSp...Correlation.txt
Там довольно своеобразный файл матрицы для факторного анализа конструируется, в котором первые три строки (cases) среднее, SD, N по каждой переменной, далее попарные корреляции по каждой переменной ( Спирмена или Кендалла, какие заявить; можно и другие меры связи засунуть). А что за специальные множители, г-н Плав, можно пояснить (хотя бы на уровне ключевых слов)?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- marinakom   Логлинейный анализ   30.01.2008 - 11:31
- - nokh   В вашей ситуации логлинейный анализ вряд ли подойд...   31.01.2008 - 17:21
|- - marinakom   Спасибо за участие к моим проблемам! Отвечаю и...   1.02.2008 - 00:10
- - nokh   Ну вот, раз дела обстоят так, то по части регресси...   1.02.2008 - 22:33
|- - marinakom   Разные виды моделей (анализов, подходов). Не спор...   2.02.2008 - 01:12
- - плав   Как только было написано, что есть переменная откл...   5.02.2008 - 18:39
- - nokh   В свое время читал, что вращения - это для факторн...   5.02.2008 - 23:06
- - плав   Вопрос веры - это вопрос, который не обсуждается. ...   6.02.2008 - 01:56
|- - marinakom   Господа! Наша дискуссия разделилась на две вет...   6.02.2008 - 11:11
- - Игорь   Цитата(nokh @ 5.02.2008 - 23:06) В с...   6.02.2008 - 09:35
|- - nokh   Цитата(Игорь @ 6.02.2008 - 12:35) Сн...   10.06.2010 - 22:46
- - плав   Цитата(Игорь @ 6.02.2008 - 09:35) На...   6.02.2008 - 13:27
- - Игорь   Цитата(плав @ 6.02.2008 - 01:56) В п...   13.02.2008 - 12:19
|- - плав   Цитата(Игорь @ 13.02.2008 - 12:19) П...   13.02.2008 - 16:39
- - Игорь   Цитата(плав @ 13.02.2008 - 16:39) А ...   14.02.2008 - 13:52
- - плав   Цитата(Игорь @ 14.02.2008 - 13:52) Н...   15.02.2008 - 13:44


Добавить ответ в эту темуОткрыть тему