Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Факторный анализ, смешанных признаков
Игорь
сообщение 21.02.2023 - 20:05
Сообщение #1





Группа: Пользователи
Сообщений: 1141
Регистрация: 10.04.2007
Пользователь №: 4040



Хотелось бы предложить для обсуждения следующую проблему. Факторный анализ, как известно, связан с решением проблемы собственных значений, варимаксом, оценкой общностей и т.д., в зависимости от метода. Но основное - построить корреляционную матрицу. При использовании количественных признаков корреляционная матрица состоит из коэффициентов корреляции Пирсона, посчитанных из взятых попарно признаков. Построенная таким образом корреляционная матрица является положительно полуопределенной (матрицей Грама), что гарантирует неотрицательность собственных значений (эквивалентных мере дисперсии, объясняемой факторами) и действительность собственных векторов, которыми можно изобразить близость признаков.
Некоторыми авторами, однако, выдвигалась идея построения корреляционной матрицы из коэффициентов корреляции для порядковых признаков (Кендалла, Спирмена) и даже коэффициентов типа корреляции для бинарных и смешанных признаков (в том числе подход Гауэра). Вот тут и начинаются проблемы. Авторы, очевидно, дальше теоретических изысканий не шли, а зря. Расчеты показывают, что корреляционная матрица, построенная из неколичественных признаков, матрицей Грама часто не является со всеми вытекающими сложностями (отрицательные собственные значения и комплексные собственные вектора), препятствующими интерпретации результатов расчета.
P.S. Вопрос возник в ходе работы по проверке и активации в ПО StatAnt факторного анализа по просьбам пользователей.

Сообщение отредактировал Игорь - 21.02.2023 - 21:09


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
100$
сообщение 23.02.2023 - 22:53
Сообщение #2





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата
А корреляционная матрица для всей этой красоты - только из коэффициентов Пирсона. Об остальном лучше не упоминать.


Выложил хохмы для пример по собственному формату:
1) три дихотомических переменных;
2) три таблицы сопряженности: 1 vs 2, etc.
3) три тетрахорических коэффициента по Bonett & Price (2005)

Voila!

И единицы на главной диагонали пробовал, и общности в корреляционной матрице- на глаз - все работает.
Файл прикрепил.


Прикрепленные файлы
Прикрепленный файл  ФА_дихотомических_переменных.rar ( 14,59 килобайт ) Кол-во скачиваний: 1002
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 24.02.2023 - 17:08
Сообщение #3





Группа: Пользователи
Сообщений: 1141
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(100$ @ 23.02.2023 - 23:53) *
Выложил хохмы для пример по собственному формату:
1) три дихотомических переменных;
2) три таблицы сопряженности: 1 vs 2, etc.
3) три тетрахорических коэффициента по Bonett & Price (2005)
Voila!
И единицы на главной диагонали пробовал, и общности в корреляционной матрице- на глаз - все работает.
Файл прикрепил.

Спасибо огромное за пример. Это такая же ценность, как исходный код. Сделал факторный анализ на основе тетрахорического коэффициента, что действительно необходимо пользователям. Заодно добавил и другие методы анализа для дихотомических переменных в соответствующие разделы.
Но немного о плохом. Видимо, давно не занимался данным разделом статистики - делал факторный анализ по просьбе биологов в году этак 1993. Оказалось, за прошедшее время коэффициент Бравайса (он же Ф, он же БЫЛ тетрахорическим) стал неактуальным. Тетрахорический коэффициент стал ареной интеллектуальных сражений. Аппроксимаций неимоверное количество. Взял здесь https://real-statistics.com/correlation/pol...on-estimation/).
Немного погорячился с невозможностью факторного анализа неколичественных признаков, но вспомнил - речь была о смешанных признаках, т.е. массив данных представляет собой набор признаков, измеренных в разных шкалах, а корреляционная матрица - соответственно, смесь в одной куче различных коэффициентов корреляции (Пирсона, Кендалла, Бравайса, точечно-бисериальные). Возможно, решение данной проблемы состоит в предварительной нормализации (натолкнула идея из Вашего примера) и применении одного коэффициента корреляции (например, Пирсона) для вычисления всей корреляционной матрицы, а не в зоопарке коэффициентов.

Сообщение отредактировал Игорь - 24.02.2023 - 19:37


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Игорь   Факторный анализ   21.02.2023 - 20:05
- - 100$   Эпиграф: "Нет матрицы Грама - нет факторного ...   22.02.2023 - 15:24
|- - Игорь   Цитата(100$ @ 22.02.2023 - 15:2...   23.02.2023 - 18:08
- - 100$   ЦитатаА корреляционная матрица для всей этой красо...   23.02.2023 - 22:53
|- - Игорь   Цитата(100$ @ 23.02.2023 - 23:5...   24.02.2023 - 17:08
|- - 100$   Цитата(Игорь @ 24.02.2023 - 17:08) А...   24.02.2023 - 23:24
|- - nokh   Цитата(100$ @ 25.02.2023 - 01:2...   26.02.2023 - 20:09
|- - Игорь   Цитата(nokh @ 26.02.2023 - 21:09) Да...   26.02.2023 - 21:57
- - Игорь   Ну вот, как всегда - в самом конце, уже собирался ...   25.02.2023 - 08:45
|- - 100$   Цитата(Игорь @ 25.02.2023 - 08:45) П...   25.02.2023 - 12:50
|- - ИНО   Цитата(Игорь @ 25.02.2023 - 08:45) Ч...   25.02.2023 - 16:57
- - Игорь   Внимательное обдумывание предложенной темы заставл...   28.02.2023 - 06:58
|- - 100$   Цитата(Игорь @ 28.02.2023 - 06:58) К...   1.03.2023 - 16:42
|- - Игорь   Цитата(100$ @ 1.03.2023 - 16:42...   1.03.2023 - 20:11
- - 100$   Надо бы еще информационный коэффициент корреляции ...   2.03.2023 - 11:58
|- - Игорь   Цитата(100$ @ 2.03.2023 - 11:58...   2.03.2023 - 12:05
|- - 100$   Цитата(Игорь @ 2.03.2023 - 12:05) Сп...   2.03.2023 - 16:32
|- - Игорь   Цитата(100$ @ 2.03.2023 - 17:32...   4.03.2023 - 15:48
|- - passant   Цитата(Игорь @ 4.03.2023 - 15:48) P....   4.03.2023 - 18:03
- - ИНО   2-3 обязательно нужно. А лучше - чтобы пользовател...   4.03.2023 - 18:57
- - Игорь   Аналогичная проблема в многомерном шкалировании, к...   7.03.2023 - 18:01
|- - 100$   А диаграммы Шеппарда будут? В многомерном шкалиров...   7.03.2023 - 22:23
- - ИНО   Цитатадля многомерного шкалирования - только Евкли...   7.03.2023 - 23:53
|- - Игорь   Цитата(ИНО @ 8.03.2023 - 00:53) евкл...   18.03.2023 - 22:57
- - Игорь   Введение набора протестированных базовых методов в...   8.03.2023 - 16:03


Добавить ответ в эту темуОткрыть тему