![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 18.06.2014 Пользователь №: 26469 ![]() |
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 18.06.2014 Пользователь №: 26469 ![]() |
Уточните, что значит ситуация если тот единственный фактор, который имеет такую хорошую альфу и собирает большинство переменных имеет дисперсию всего в 25%?
И скажите пожалуйста, какие приняты процедуры после ФА для улучшения прогностической способности выделенного фактора? Что если все входящие в него переменные провести через ROC- анализ и оставить потом только те у которых AUC будет больше 0,6? Сообщение отредактировал малой - 27.01.2016 - 22:52 |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Уточните, что значит ситуация если тот единственный фактор, который имеет такую хорошую альфу и собирает большинство переменных имеет дисперсию всего в 25%? И скажите пожалуйста, какие приняты процедуры после ФА для улучшения прогностической способности выделенного фактора? Что если все входящие в него переменные провести через ROC- анализ и оставить потом только те у которых AUC будет больше 0,6? Объясняемая дисперсия для первого фактора 25% - это мало. Значит последующие - ещё меньше, т.е. вся система не сильно коррелированная. Для ФА в любом его приложении это не очень хорошо. Но насколько я понял у вас задача другая: вы просто ищете разные способы разделить свои группы. Если цель именно в этом, то ФА даже теоретически не очень хорош: задача этого метода - выявлять общее, а не специфику. По выделенному общему фактору группы могут и не сильно различаться или даже вообще не различаться. Например, если мы будем искать этнические различия между людьми по морфометрии 100 признаков тела и черепа, то они никак не окажутся в первом факторе: в него войдёт размерно-возрастная изменчивость общая для всех. При этом какой-нибудь специфический лицевой индекс из всего двух-трёх показателей из 100 замечательно справится с задачей. На всякий случай посмотрите распределение индивидуальных меток (factor scores) для ГК1 или Фактора 1 - если оно выраженное бимодальное - есть шансы использовать значение фактора в качестве различающей функции, если нет - и смысла нет что-то улучшать. В рамках факторного анализа можно ввести в анализ показатель "группа", с метками 1, 2 и посмотреть какие переменные сильнее войдут в один фактор с фактором, для которого нагрузка показателя "группа" будет максимальной - по ним группы и различаются сильнее всего. Или ввести метку "группа", которая сама в анализе участвовать не будет, но будет отслеживаться (SPSS, например, это позволяет). Но это только несколько экзотические пути разведочного анализа, но не путь поиска лучшего дискриминатора. Для задачи разделения групп более уместны методы дискриминантного анализа, логистической регресси и того, что вам ещё советовали для этого. В самых сложных и запутанных ситуациях классическая (и не очень) статистика вообще может оказаться бессильной и нужно искать что-то из арсеналов Data mining (хотя бы деревья классификации (classification tree) и их леса (random forest)) или нейронных сетей. Посоветовал бы начать с дискриминантного анализа, но сам знаю только линейный, а он, строго говоря, для порядковых переменных не годится. Может вам другие участники ещё порекомендуют чего-то полезного в этой ситуации. Сообщение отредактировал nokh - 30.01.2016 - 11:10 |
|
![]() |
![]() |
![]() ![]() |