![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 18.06.2014 Пользователь №: 26469 ![]() |
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 18.06.2014 Пользователь №: 26469 ![]() |
Подскажите мне пожалуйста еще по следующему вопросу. Исследую 2 методики. По критерию Кайзера, было выделено 6 факторов в обоих случаях (значения больше 1). А вот по критерию Кеттела (каменистая осыпь) точка перегиба в приходится на второй фактор (также в обоих случаях). Графики в приложении (методика 1 и методика 2). Правильно ли я понимаю, что по критерию Кеттела отобрано от одного до трёх факторов для анализа? И как принято поступать в случаях когда получается такая значительная разбежка между результатами проверки по указанным критериям?
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Подскажите мне пожалуйста еще по следующему вопросу. Исследую 2 методики. По критерию Кайзера, было выделено 6 факторов в обоих случаях (значения больше 1). А вот по критерию Кеттела (каменистая осыпь) точка перегиба в приходится на второй фактор (также в обоих случаях). Графики в приложении (методика 1 и методика 2). Правильно ли я понимаю, что по критерию Кеттела отобрано от одного до трёх факторов для анализа? И как принято поступать в случаях когда получается такая значительная разбежка между результатами проверки по указанным критериям? Методов много, есть и более современные вещи типа "сломанной трости" ("стержня") - broken stick, но лучше уже рекомендованого вам р2004r бутстрепа всё равно нет. Отсутствие чёткого излома на графике осыпи указывает на слабые корреляции в наборе данных. На практике это обычно бывает тогда, когда в анализ включают дихотомические переменные и/или порядковые с малым числом рангов. Если у вас в наборе именно такие переменные, то факторный анализ (в узком смысле этого термина) проводить некорректно, лучше ограничиться анализом главных компонент, но с вращением. Также пирсоновские корреляции снижают нелинейные связи - с этим тоже обязательно нужно попытаться бороться: 1) Использовать преобразования шкалы из семейства степенных преобразований, лучше - преобразование Бокса - Кокса. Многие связи являются слабыми или нелинейными именно в результате "эффекта шкалы" - нужно его снять. Вот здесь можете посмотреть интересную тему, где я показывал как преобразование позволят линеаризировать связь, а следом - найти что-то важное: http://molbiol.ru/forums/index.php?showtopic=553421 , URL # 19. Многомерное преобразование Бокса - Кокса насколько я знаю, есть только в пакете И. Гайдышева AtteStat, но на практике хорошие результаты даёт и одномерное попеременное преобразование, которое проще всего сделать в PAST. 2) Использовать специальное линеаризующее преобразование для многомерного пространства - преобразование Джифи (Gifi transformation). Оно есть в пакете SPSS (снижение размерности - оптимальное шкалирование - CATPCA) и в пакете homals для R. Что делать если в выделенном факторе только одна переменная подходящая по уровню для интерпретации? Назвать этот фактор именем переменной? Да. Но появление таких специфических факторов указывает на ту же проблему плохой обобщаемости данных. Он, конечно, берёт на себя часть общей объяснённой дисперсии (в рамках модели главных компонент) или восстановленной корреляции ( в рамках модели факторного анализа), но по-сути не обобщает никак данные, т.е. он - сам по себе. Сообщение отредактировал nokh - 26.03.2015 - 21:14 |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 18.06.2014 Пользователь №: 26469 ![]() |
Отсутствие чёткого излома на графике осыпи указывает на слабые корреляции в наборе данных. На практике это обычно бывает тогда, когда в анализ включают дихотомические переменные и/или порядковые с малым числом рангов. Если у вас в наборе именно такие переменные, то факторный анализ (в узком смысле этого термина) проводить некорректно, лучше ограничиться анализом главных компонент, но с вращением Да именно такие порядковые переменные у меня: 0,1,2. Провел анализ главных компонент (АГК). Даже при принудительном выделении большего количества факторов практически все переменные пригодные для интерпретации сваливаются в один компонент. Интерпретируются они хорошо, но Альфа Кронбаха в первом факторе высокая а в остальных (там по 2-3 переменных) альфа плохая. Последующий ROC анализ тоже хвалит первый фактор, последующие ругает как совсем непригодные (кривая лежит на диагональной линии). Такие результаты значат, что АГК себя не оправдал или наоборот и нужно принимать первую компоненту за эффективный вариант методики а остальные просто игнорировать? Сообщение отредактировал малой - 27.01.2016 - 00:08 |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Да именно такие порядковые переменные у меня: 0,1,2. Провел анализ главных компонент (АГК). Даже при принудительном выделении большего количества факторов практически все переменные пригодные для интерпретации сваливаются в один компонент. Интерпретируются они хорошо, но Альфа Кронбаха в первом факторе высокая а в остальных (там по 2-3 переменных) альфа плохая. Последующий ROC анализ тоже хвалит первый фактор, последующие ругает как совсем непригодные (кривая лежит на диагональной линии). Такие результаты значат, что АГК себя не оправдал или наоборот и нужно принимать первую компоненту за эффективный вариант методики а остальные просто игнорировать? Хорошо это или плохо - зависит от целей работы. 1). Eсли это только разведочный (эксплораторный) анализ, то на альфу Кронбаха можно вообще не смотреть, руководствуясь более специфическими индикаторами необходимого и достаточного для понимания структуры данных числа факторов. Здесь важно максимально контрастировать факторы, поэтому обязательно нужно применять прямоугольное вращение (обычно используют варимакс). Может быть такая ситуация, что в обычном АГК первые компоненты объясняют, скажем, 50, 20 и 15% дисперсии, а после выделения именно 3 факторов и вращения получится 45, 35 и 10%. Т.е. после вращения часто вклады факторов перераспределяются так, что "вес" второстепенного (второстепенных) фактора (ов) увеличивается + сильно улучшается их интерпретируемость. В таком варианте анализа один единственный главный фактор - плохо с точки зрения новизны выводов из работы. В первый фактор всегда выходят уже достаточно подробно изученные явления или процессы, к пониманию которых люди пришли уже давно и безо всяких хитрых статистических техник; как правило, они даже описаны в учебниках. А вот то, что входит в последующие факторы часто - менее изученное, т.к. завуалировано более сильными процессами первого фактора. 2). Если цель анализа - конструирование шкалы, индекса для измерения чего-либо, то, напротив, один фактор - это здорово. Если все показатели сильно вкладываются в один латентный фактор, значит шкала имеет высокую факторную валидность, которую можно рассматривать как показатель конструктной валидности - т.е. что шкала измеряет именно то самое и единственное, для чего она, собственно, и разрабатывается. Причём чем сильнее коррелируют между собой показатели этого фактора (показывает альфа Кронбаха), тем надёжнее шкала. В этом случае наличие сильных второстепенных факторов вообще нежелательно, т.к. они являются по-сути вмешивающимися (confounding) - стоящие за ними процессы только вносят раздрай в процесс первого фактора и неопределённость в его измерение. Если цель работы такая, то от показателей, не вкладывающих в первый фактор можно просто избавиться. С теоретической точки зрения валидность и надёжность - более важные характеристики чем просто AUC ROC-кривой: они показывают, что разработанный инструмент работает правильно и полученные с его помощью оценки надёжны. А оценка эффективности этого инструмента для диагностики - следующий шаг с явным прикладным аспектом. Сообщение отредактировал nokh - 27.01.2016 - 11:14 |
|
![]() |
![]() |
![]() ![]() |