Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> Интерпретация Дискриминантного анализа
klavdia
сообщение 24.03.2015 - 22:57
Сообщение #1





Группа: Пользователи
Сообщений: 16
Регистрация: 10.03.2015
Пользователь №: 27089



Здравствуйте, так получилось, что мне понадобилась ещё помощь:) Я провела дискриминантный анализ. (В основном использовала шаги, которые описаны в книги А.Д. Наследова)
Однако, у меня получились странные результаты, у меня было много переменных, но они все вошли в одну дискриминатную функцию. Это нормально или нет?
И как тогда трактовать результаты? Если смотреть Функции в центройдах групп ,то видно что это одна функции больше нагружает 1-ую группу моей зависимой переменной(всего 2 градации)

Корректно ли интерпретировать т.о: Чем больше у меня индекс поленезависимости(6,73) и меньше коммуникативный потенциал (-7,42) тем более вероятно что объект принадлежит к первой группе?
У меня файл не прикрепляет почему-то. Залила на обменник
http://rghost.ru/6JPvwmWXy

Сообщение отредактировал klavdia - 26.03.2015 - 18:51
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 24.03.2015 - 23:38
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(klavdia @ 24.03.2015 - 22:57) *
Здравствуйте, так получилось, что мне понадобилась ещё помощь:) Я провела дискриминантный анализ. (В основном использовала шаги, которые описаны в книги А.Д. Наследова)
Однако, у меня получились странные результаты, у меня было много переменных, но они все вошли в одну дискриминатную функцию. Это нормально или нет?
И как тогда трактовать результаты? Если смотреть Функции в центройдах групп ,то видно что это одна функции больше нагружает 1-ую группу моей зависимой переменной(всего 2 градации)

Корректно ли интерпретировать т.о: Чем больше у меня индекс поленезависимости(6,73) и меньше коммуникативный потенциал (-7,42) тем более вероятно что объект принадлежит к первой группе?
У меня файл не прикрепляет почему-то. Залила на обменник
http://rghost.ru/6JPvwmWXy


1) проблема в числе дискриминантных функций заключается что из число это функция от числа степеней свободы групп классификации n-1. Так что для случая двух групп возможна только одна линия проходящяя через "центроиды" наилучшим образом и полностью описывающая чем обе группы отличаются друг от друга.

2) нормализованные коэффициенты посчитаны таким образом, что бы восстановить "сферичность" ковариации внутри обоих (в данном случае) групп. В принципе такое взвешивание позволяет считать переменные равносильными. Но иногда взвешивание делать принципиально не надо, например для случая когда мы имеем принципиально одну и туже величину измеренную в различные моменты времени.

3) прикрепляются только rar архивы и изображения.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
klavdia
сообщение 26.03.2015 - 19:01
Сообщение #3





Группа: Пользователи
Сообщений: 16
Регистрация: 10.03.2015
Пользователь №: 27089



А поняла, спасибо. Значит я правильно интерпретирую данные "Чем больше у меня индекс поленезависимости(6,73) и меньше коммуникативный потенциал (-7,42) "?
Т.е. если Х1 , Х2, Х3, с положительным знаком, Х4,Х5,Х6 c отрицательным, то чем больше Х1-Х3 и меньше Х4-Х6 тем больше вероятность что наблюдение относится к первой группе
Или как правильно мне говорить о классификации.
Например в регрессии все просто. Банально сама составила уравнение и все , ну или посмотрела на КМД, то есть хоть как-то могу проинтерпретироватт
а тут не ясно как, просто дана функция нагруженная коэффициентами и что я по ним должна сказать.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 26.03.2015 - 19:11
Сообщение #4





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(klavdia @ 26.03.2015 - 19:01) *
А поняла, спасибо. Значит я правильно интерпретирую данные "Чем больше у меня индекс поленезависимости(6,73) и меньше коммуникативный потенциал (-7,42) "?
Т.е. если Х1 , Х2, Х3, с положительным знаком, Х4,Х5,Х6 c отрицательным, то чем больше Х1-Х3 и меньше Х4-Х6 тем больше вероятность что наблюдение относится к первой группе
Или как правильно мне говорить о классификации.
Например в регрессии все просто. Банально сама составила уравнение и все , ну или посмотрела на КМД, то есть хоть как-то могу проинтерпретироватт
а тут не ясно как, просто дана функция нагруженная коэффициентами и что я по ним должна сказать.


Только -- чем больше абсолютное значение стандартизированного коэффициента, тем больше его вклад. Хотя эта оценка слабая, надо считать как меняется AUC модели при удалении тех или иных предикторов.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
klavdia
сообщение 26.03.2015 - 20:28
Сообщение #5





Группа: Пользователи
Сообщений: 16
Регистрация: 10.03.2015
Пользователь №: 27089



Простите а разве в SPSS можно считать AUC для ДА, для лог.регрессии том есть галка Roc-кривых, а в дискриминантном анализе , я не видела

Т.е. я не знак не смотрю, я смотрю на значение , х1=8, х2=-7, х3=0,5, т.е. я могу сказать так, что чем больше х1 и х2 и меньше х3, тем больше эти переменные вносят свой вклад в дискриминацию первой группы?

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 26.03.2015 - 20:33
Сообщение #6





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(klavdia @ 26.03.2015 - 20:28) *
Простите а разве в SPSS можно считать AUC для ДА, для лог.регрессии том есть галка Roc-кривых, а в дискриминантном анализе , я не видела

Т.е. я не знак не смотрю, я смотрю на значение , х1=8, х2=-7, х3=0,5, т.е. я могу сказать так, что чем больше х1 и х2 и меньше х3, тем больше эти переменные вносят свой вклад в дискриминацию первой группы?


1. ROC можно считать для чего угодно, или в SPSS нет просто построения ROC вне связи с конкретным методом ML? Вот например инструкция http://www.rti4success.org/sites/default/f...racteristic.doc

2. Для стандартизированных коэффициентов именно такое использование и предполагалось, но я сразу указываю на слабость такого подхода.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
klavdia
сообщение 26.03.2015 - 20:56
Сообщение #7





Группа: Пользователи
Сообщений: 16
Регистрация: 10.03.2015
Пользователь №: 27089



ого, не знала. Спасибки.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
klavdia
сообщение 26.03.2015 - 22:00
Сообщение #8





Группа: Пользователи
Сообщений: 16
Регистрация: 10.03.2015
Пользователь №: 27089



А как корректно интерпретировать, что функция центройдов групп
1 21,367
2 -8,622

одна положительная, другая отрицательная?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 27.03.2015 - 12:39
Сообщение #9





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(klavdia @ 26.03.2015 - 22:00) *
А как корректно интерпретировать, что функция центройдов групп
1 21,367
2 -8,622

одна положительная, другая отрицательная?


У линии которая проходит через центроиды два конца, один положительный а второй отрицательный. Кто каким станет зависит от реализации алгоритма и даже может меняться при каждом вычислении. Позволяет трактовать коэффициенты в духе -- "с ростом предиктора такого растет уверенность что варианта принадлежит к такому то значению группирующей переменной"


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
klavdia
сообщение 27.03.2015 - 15:05
Сообщение #10





Группа: Пользователи
Сообщений: 16
Регистрация: 10.03.2015
Пользователь №: 27089



Уважаю людей, который точно и ясно все объясняют. Вроде вопросов больше нет. Но метод странный, хотелось бы , чтобы высчитывал уравнение вероятности принадлежания к такой-то группе.
Например, подставила значения коэф.-тов в уравнение и выдавалась вероятность, что это наблюдение 1 принадлежит к группе 1, а наблюдение 4 к группе 2 или 3.
Я не имею ввиду лог регрессию, а немного другое, т.к. в ней 2 бинарные величины. А если у меня в группирующей переменной 7 градаций(классов) =)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 27.03.2015 - 20:59
Сообщение #11





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



В пакете программ, который Вы используете, все это имеется: нужно в меню Сохранить поставить флажки Предсказанная принадлежность к группе и Вероятность принадлежности к группам . После обработки в файле данных будут добавлены три столбца (если классов два) или более (если более двух классов) для всех наблюдений (строк).
Для неоднократного прогнозирования можно создать скоринговую модель и применять ее к новым данным с помощью Конструктора скоринга в меню Сервис.
Если имеется всего два класса, то по полученным вероятностям и исходной группирующей переменной можно выполнить ROC-анализ.
Если имеется 7 классов. то будет создано 7-1= 6 канонических функций.
Прочитайте эту главу в книге до конца!

Сообщение отредактировал anserovtv - 28.03.2015 - 09:07
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 27.03.2015 - 22:25
Сообщение #12





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(klavdia @ 27.03.2015 - 15:05) *
Я не имею ввиду лог регрессию, а немного другое, т.к. в ней 2 бинарные величины. А если у меня в группирующей переменной 7 градаций(классов) =)


И тем не менее вполне подойдет Мультиномиальная логистическая регрессия.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
klavdia
сообщение 1.04.2015 - 19:38
Сообщение #13





Группа: Пользователи
Сообщений: 16
Регистрация: 10.03.2015
Пользователь №: 27089



Ещё немного консультации:))
Мы видим расстояние от 0 до 25. Например, наблюдения с 128-133 достаточно рядышком скучковались в 3 кластера. Но к кластеру 128-126 примыкает наблюдение 139 на расстояние 16. Можно ли говорить, что эти 3 наблюдения 128,126,139 схожи, близки? Если да, то как его правильно интерпретировать? 139 наблюдение далеко стоит.

ну и ещё 74 и 75 наблюдение объединились в кластер. Расстояние где-то 12. Можно ли по расстоянию говорить о силе связи?

И наконец 104 наблюдение объединилось с рядом классов кластеров это нормально или нет?
Прикрепленные файлы
Прикрепленный файл  класт.zip ( 64,03 килобайт ) Кол-во скачиваний: 236
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 1.04.2015 - 23:08
Сообщение #14





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(klavdia @ 1.04.2015 - 19:38) *
Ещё немного консультации:))
Мы видим расстояние от 0 до 25. Например, наблюдения с 128-133 достаточно рядышком скучковались в 3 кластера. Но к кластеру 128-126 примыкает наблюдение 139 на расстояние 16. Можно ли говорить, что эти 3 наблюдения 128,126,139 схожи, близки? Если да, то как его правильно интерпретировать? 139 наблюдение далеко стоит.

ну и ещё 74 и 75 наблюдение объединились в кластер. Расстояние где-то 12. Можно ли по расстоянию говорить о силе связи?

И наконец 104 наблюдение объединилось с рядом классов кластеров это нормально или нет?


1) Паковать картинку в эксель, потом паковать эксель в зип вовсе не обязательно, поскольку форум прекрасно поддерживает присоединение картинок. И у такого способа есть еще одно достоинство -- картинка сразу видна smile.gif Вот данные для построения картинки в виде экселя завернутого в zip выложить бы следовало.

2) Вот так вот лихо взять и "засунуть" транспонированную таблицу с данными и получить корректную картину нельзя. Люди напрягаются и пишут целые пакеты:
Код
     Ascendant hierarchical clustering of a set of variables.
     Variables can be quantitative, qualitative or a mixture of both.
     The aggregation criterion is the decrease in homogeneity for the
     cluster being merged. The homogeneity of a cluster is the sum of
     the correlation ratio (for qualitative variables) and the squared
     correlation (for quantitative variables) between the variables and
     the center of the cluster which is the first principal component
     of PCAmix. PCAmix is defined for a mixture of qualitative and
     quantitative variables and includes ordinary principal component
     analysis (PCA) and multiple correspondence analysis (MCA) as
     special cases. Missing values are replaced by means for
     quantitative variables and by zeros in the indicator matrix for
     qualitative variables.


Вот Вы что использовали для получения этой картинки?


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
klavdia
сообщение 2.04.2015 - 22:44
Сообщение #15





Группа: Пользователи
Сообщений: 16
Регистрация: 10.03.2015
Пользователь №: 27089



данные не крепятся
но залила)
--http://rghost. ru/8mLbmq4Vg
ой., а я не знаю какой пакет использовала, я в SPSS делала:) Может там автоматически выставляется. Это можно узнать?

Сообщение отредактировал klavdia - 2.04.2015 - 22:45
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему