Интерпретация Дискриминантного анализа |
Здравствуйте, гость ( Вход | Регистрация )
Интерпретация Дискриминантного анализа |
24.03.2015 - 22:57
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 16 Регистрация: 10.03.2015 Пользователь №: 27089 |
Здравствуйте, так получилось, что мне понадобилась ещё помощь:) Я провела дискриминантный анализ. (В основном использовала шаги, которые описаны в книги А.Д. Наследова)
Однако, у меня получились странные результаты, у меня было много переменных, но они все вошли в одну дискриминатную функцию. Это нормально или нет? И как тогда трактовать результаты? Если смотреть Функции в центройдах групп ,то видно что это одна функции больше нагружает 1-ую группу моей зависимой переменной(всего 2 градации) Корректно ли интерпретировать т.о: Чем больше у меня индекс поленезависимости(6,73) и меньше коммуникативный потенциал (-7,42) тем более вероятно что объект принадлежит к первой группе? У меня файл не прикрепляет почему-то. Залила на обменник http://rghost.ru/6JPvwmWXy Сообщение отредактировал klavdia - 26.03.2015 - 18:51 |
|
24.03.2015 - 23:38
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Здравствуйте, так получилось, что мне понадобилась ещё помощь:) Я провела дискриминантный анализ. (В основном использовала шаги, которые описаны в книги А.Д. Наследова) Однако, у меня получились странные результаты, у меня было много переменных, но они все вошли в одну дискриминатную функцию. Это нормально или нет? И как тогда трактовать результаты? Если смотреть Функции в центройдах групп ,то видно что это одна функции больше нагружает 1-ую группу моей зависимой переменной(всего 2 градации) Корректно ли интерпретировать т.о: Чем больше у меня индекс поленезависимости(6,73) и меньше коммуникативный потенциал (-7,42) тем более вероятно что объект принадлежит к первой группе? У меня файл не прикрепляет почему-то. Залила на обменник http://rghost.ru/6JPvwmWXy 1) проблема в числе дискриминантных функций заключается что из число это функция от числа степеней свободы групп классификации n-1. Так что для случая двух групп возможна только одна линия проходящяя через "центроиды" наилучшим образом и полностью описывающая чем обе группы отличаются друг от друга. 2) нормализованные коэффициенты посчитаны таким образом, что бы восстановить "сферичность" ковариации внутри обоих (в данном случае) групп. В принципе такое взвешивание позволяет считать переменные равносильными. Но иногда взвешивание делать принципиально не надо, например для случая когда мы имеем принципиально одну и туже величину измеренную в различные моменты времени. 3) прикрепляются только rar архивы и изображения. |
|
26.03.2015 - 19:01
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 16 Регистрация: 10.03.2015 Пользователь №: 27089 |
А поняла, спасибо. Значит я правильно интерпретирую данные "Чем больше у меня индекс поленезависимости(6,73) и меньше коммуникативный потенциал (-7,42) "?
Т.е. если Х1 , Х2, Х3, с положительным знаком, Х4,Х5,Х6 c отрицательным, то чем больше Х1-Х3 и меньше Х4-Х6 тем больше вероятность что наблюдение относится к первой группе Или как правильно мне говорить о классификации. Например в регрессии все просто. Банально сама составила уравнение и все , ну или посмотрела на КМД, то есть хоть как-то могу проинтерпретироватт а тут не ясно как, просто дана функция нагруженная коэффициентами и что я по ним должна сказать. |
|
26.03.2015 - 19:11
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
А поняла, спасибо. Значит я правильно интерпретирую данные "Чем больше у меня индекс поленезависимости(6,73) и меньше коммуникативный потенциал (-7,42) "? Т.е. если Х1 , Х2, Х3, с положительным знаком, Х4,Х5,Х6 c отрицательным, то чем больше Х1-Х3 и меньше Х4-Х6 тем больше вероятность что наблюдение относится к первой группе Или как правильно мне говорить о классификации. Например в регрессии все просто. Банально сама составила уравнение и все , ну или посмотрела на КМД, то есть хоть как-то могу проинтерпретироватт а тут не ясно как, просто дана функция нагруженная коэффициентами и что я по ним должна сказать. Только -- чем больше абсолютное значение стандартизированного коэффициента, тем больше его вклад. Хотя эта оценка слабая, надо считать как меняется AUC модели при удалении тех или иных предикторов. |
|
26.03.2015 - 20:28
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 16 Регистрация: 10.03.2015 Пользователь №: 27089 |
Простите а разве в SPSS можно считать AUC для ДА, для лог.регрессии том есть галка Roc-кривых, а в дискриминантном анализе , я не видела
Т.е. я не знак не смотрю, я смотрю на значение , х1=8, х2=-7, х3=0,5, т.е. я могу сказать так, что чем больше х1 и х2 и меньше х3, тем больше эти переменные вносят свой вклад в дискриминацию первой группы? |
|
26.03.2015 - 20:33
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Простите а разве в SPSS можно считать AUC для ДА, для лог.регрессии том есть галка Roc-кривых, а в дискриминантном анализе , я не видела Т.е. я не знак не смотрю, я смотрю на значение , х1=8, х2=-7, х3=0,5, т.е. я могу сказать так, что чем больше х1 и х2 и меньше х3, тем больше эти переменные вносят свой вклад в дискриминацию первой группы? 1. ROC можно считать для чего угодно, или в SPSS нет просто построения ROC вне связи с конкретным методом ML? Вот например инструкция http://www.rti4success.org/sites/default/f...racteristic.doc 2. Для стандартизированных коэффициентов именно такое использование и предполагалось, но я сразу указываю на слабость такого подхода. |
|
26.03.2015 - 20:56
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 16 Регистрация: 10.03.2015 Пользователь №: 27089 |
ого, не знала. Спасибки.
|
|
26.03.2015 - 22:00
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 16 Регистрация: 10.03.2015 Пользователь №: 27089 |
А как корректно интерпретировать, что функция центройдов групп
1 21,367 2 -8,622 одна положительная, другая отрицательная? |
|
27.03.2015 - 12:39
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
А как корректно интерпретировать, что функция центройдов групп 1 21,367 2 -8,622 одна положительная, другая отрицательная? У линии которая проходит через центроиды два конца, один положительный а второй отрицательный. Кто каким станет зависит от реализации алгоритма и даже может меняться при каждом вычислении. Позволяет трактовать коэффициенты в духе -- "с ростом предиктора такого растет уверенность что варианта принадлежит к такому то значению группирующей переменной" |
|
27.03.2015 - 15:05
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 16 Регистрация: 10.03.2015 Пользователь №: 27089 |
Уважаю людей, который точно и ясно все объясняют. Вроде вопросов больше нет. Но метод странный, хотелось бы , чтобы высчитывал уравнение вероятности принадлежания к такой-то группе.
Например, подставила значения коэф.-тов в уравнение и выдавалась вероятность, что это наблюдение 1 принадлежит к группе 1, а наблюдение 4 к группе 2 или 3. Я не имею ввиду лог регрессию, а немного другое, т.к. в ней 2 бинарные величины. А если у меня в группирующей переменной 7 градаций(классов) =) |
|
27.03.2015 - 20:59
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 |
В пакете программ, который Вы используете, все это имеется: нужно в меню Сохранить поставить флажки Предсказанная принадлежность к группе и Вероятность принадлежности к группам . После обработки в файле данных будут добавлены три столбца (если классов два) или более (если более двух классов) для всех наблюдений (строк).
Для неоднократного прогнозирования можно создать скоринговую модель и применять ее к новым данным с помощью Конструктора скоринга в меню Сервис. Если имеется всего два класса, то по полученным вероятностям и исходной группирующей переменной можно выполнить ROC-анализ. Если имеется 7 классов. то будет создано 7-1= 6 канонических функций. Прочитайте эту главу в книге до конца! Сообщение отредактировал anserovtv - 28.03.2015 - 09:07 |
|
27.03.2015 - 22:25
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Я не имею ввиду лог регрессию, а немного другое, т.к. в ней 2 бинарные величины. А если у меня в группирующей переменной 7 градаций(классов) =) И тем не менее вполне подойдет Мультиномиальная логистическая регрессия. |
|
1.04.2015 - 19:38
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 16 Регистрация: 10.03.2015 Пользователь №: 27089 |
Ещё немного консультации:))
Мы видим расстояние от 0 до 25. Например, наблюдения с 128-133 достаточно рядышком скучковались в 3 кластера. Но к кластеру 128-126 примыкает наблюдение 139 на расстояние 16. Можно ли говорить, что эти 3 наблюдения 128,126,139 схожи, близки? Если да, то как его правильно интерпретировать? 139 наблюдение далеко стоит. ну и ещё 74 и 75 наблюдение объединились в кластер. Расстояние где-то 12. Можно ли по расстоянию говорить о силе связи? И наконец 104 наблюдение объединилось с рядом классов кластеров это нормально или нет?
Прикрепленные файлы
|
|
1.04.2015 - 23:08
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Ещё немного консультации:)) Мы видим расстояние от 0 до 25. Например, наблюдения с 128-133 достаточно рядышком скучковались в 3 кластера. Но к кластеру 128-126 примыкает наблюдение 139 на расстояние 16. Можно ли говорить, что эти 3 наблюдения 128,126,139 схожи, близки? Если да, то как его правильно интерпретировать? 139 наблюдение далеко стоит. ну и ещё 74 и 75 наблюдение объединились в кластер. Расстояние где-то 12. Можно ли по расстоянию говорить о силе связи? И наконец 104 наблюдение объединилось с рядом классов кластеров это нормально или нет? 1) Паковать картинку в эксель, потом паковать эксель в зип вовсе не обязательно, поскольку форум прекрасно поддерживает присоединение картинок. И у такого способа есть еще одно достоинство -- картинка сразу видна Вот данные для построения картинки в виде экселя завернутого в zip выложить бы следовало. 2) Вот так вот лихо взять и "засунуть" транспонированную таблицу с данными и получить корректную картину нельзя. Люди напрягаются и пишут целые пакеты: Код Ascendant hierarchical clustering of a set of variables. Variables can be quantitative, qualitative or a mixture of both. The aggregation criterion is the decrease in homogeneity for the cluster being merged. The homogeneity of a cluster is the sum of the correlation ratio (for qualitative variables) and the squared correlation (for quantitative variables) between the variables and the center of the cluster which is the first principal component of PCAmix. PCAmix is defined for a mixture of qualitative and quantitative variables and includes ordinary principal component analysis (PCA) and multiple correspondence analysis (MCA) as special cases. Missing values are replaced by means for quantitative variables and by zeros in the indicator matrix for qualitative variables. Вот Вы что использовали для получения этой картинки? |
|
2.04.2015 - 22:44
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 16 Регистрация: 10.03.2015 Пользователь №: 27089 |
данные не крепятся
но залила) --http://rghost. ru/8mLbmq4Vg ой., а я не знаю какой пакет использовала, я в SPSS делала:) Может там автоматически выставляется. Это можно узнать? Сообщение отредактировал klavdia - 2.04.2015 - 22:45 |
|