Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Дискриминантный анализ
tvsova80
сообщение 27.02.2018 - 17:34
Сообщение #1


Дух форума
*

Группа: Пользователи
Сообщений: 6
Регистрация: 19.10.2017
Пользователь №: 30388



Здравствуйте.

Могли бы Вы оказать помощь-консультацию по дискриминантному анализу:
При построении дискриминационной функции по формуле при подставлении значений получаем определенный "балл", и, в зависимости от значений в таблице "Функции в центроидах групп", мы определяем к какой группе отнести конкретного обследуемого, а как определить какой конкретный начальный порог имеют группы, из чего исходить при интерпретации конкретных результатов? Так как формулировка "чем больше отрицательное значение полученного дискриминантного показателя, тем выше вероятность принадлежать к группе эффективных руководителей" - это не конкретное определение, от какого именно числа отталкиваться? Ведь центроиды - это средние значения показателей, поэтому порогом они не будут являться, правильно понимаю? Например: в группе эффективных функция в центроидах групп = - 0,547, а в группе менее эффективных = 1,393.
И всегда ли граничным значением для двух групп в дискриминантном анализе будет ноль?
Проверяла свое предположение: я вставила в уравнение усредненные значения по группам (эффективных и менее эффективных), чтобы получить итоговый результат - предполагала, что это и будет порогом для каждой группы. Получились данные: эффективные = - 0,449 (как я рассуждаю, что начиная от - 0,449 и ниже будут попадать в группу эффективных), менее эффективные = + 0,061 (следовательно, от 0,061 и выше будут попадать в группу менее эффективных). Затем я вставила в формулу с полученными нестандартизированными коэффициентами конкретные данные людей из полярных групп и решала уравнение, и не всегда отрицательное значение принадлежало человеку из группы эффективных, и наоборот. А также могут же быть и такие результаты, которые попадут между полученными итоговыми "баллами" при решении уравнения, например, -0,125 или 0,057 и т.д. Правильно ли я понимаю, что данные результаты будут отнесены к "средним" (не к эффективным, и не к менее эффективным)?

Каким образом можно определить порог, от которого отталкиваться?

Спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 1.03.2018 - 00:42
Сообщение #2


Дух форума
*

Группа: Пользователи
Сообщений: 1318
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(tvsova80 @ 27.02.2018 - 18:34) *
Каким образом можно определить порог, от которого отталкиваться?

В каноническом дискриминантном анализе:
Центроид - среднее значение дискримирующей функции в исследуемых группах.
По вашим данным, если вы верно нашли:
Центроид 1 группы -0,547
Центроид 2 группы 1,393
Объект классифицируется в ту группу, к которой ближе расчетное значение функции.
(-0,547+1,393)/2=0,423
Это число и есть граница раздела.

Полезно получить значения центроидов самостоятельно, сохранив значения дискриминирующих функций для каждого объекта выборки и сравнить их средние значения. Не забудьте только о стандартизации исходных переменных и использовании для расчета функций соответствующих коэффициентов. Качество дискриминации ( % ) посмотрите в таблице. Тогда поймете, что не всегда расчетная и реальная принадлежность к группе совпадает.

Но, если вы психолог и работаете с различными тестами, шкалами оценок, то при классификации в два класса, лучше использовать логистическую регрессию. В этом случае вы получите вероятность принадлежности к конкретной группе и можете выделять промежуточные состояния, которые могут представлять интерес в плане коррекции этих состояний.
Эта расчетная вероятность принадлежности к определенной группе может быть полезна также при оценке динамики изменения результатов тестирования (ваш вопрос в другой ветке). Например, вероятность быть успешным спасателем при заключении контракта была 95%, через 5 лет только 65%.

Сообщение отредактировал DrgLena - 1.03.2018 - 00:43
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
tvsova80
сообщение 20.03.2018 - 12:12
Сообщение #3


Дух форума
*

Группа: Пользователи
Сообщений: 6
Регистрация: 19.10.2017
Пользователь №: 30388



Цитата(DrgLena @ 1.03.2018 - 00:42) *
В каноническом дискриминантном анализе:
Центроид - среднее значение дискримирующей функции в исследуемых группах.
По вашим данным, если вы верно нашли:
Центроид 1 группы -0,547
Центроид 2 группы 1,393
Объект классифицируется в ту группу, к которой ближе расчетное значение функции.
(-0,547+1,393)/2=0,423
Это число и есть граница раздела.

Полезно получить значения центроидов самостоятельно, сохранив значения дискриминирующих функций для каждого объекта выборки и сравнить их средние значения. Не забудьте только о стандартизации исходных переменных и использовании для расчета функций соответствующих коэффициентов. Качество дискриминации ( % ) посмотрите в таблице. Тогда поймете, что не всегда расчетная и реальная принадлежность к группе совпадает.

Но, если вы психолог и работаете с различными тестами, шкалами оценок, то при классификации в два класса, лучше использовать логистическую регрессию. В этом случае вы получите вероятность принадлежности к конкретной группе и можете выделять промежуточные состояния, которые могут представлять интерес в плане коррекции этих состояний.
Эта расчетная вероятность принадлежности к определенной группе может быть полезна также при оценке динамики изменения результатов тестирования (ваш вопрос в другой ветке). Например, вероятность быть успешным спасателем при заключении контракта была 95%, через 5 лет только 65%.




Спасибо.
Могли бы Вы мне еще подсказать информацию по дискриминантному анализу: есть 3 группы - эффективные, менее эффективные, средние. Также обработали их дискриминантным анализом, получили 2 функции и для каждой функции свои нестандартизированные коэффициенты и константу, а также свои центроиды. Следовательно, формула сложить полученные центроиды и разделить на 2 (количество групп) здесь "не работает", так как группы не равные. Каким образом здесь возможно определить порог принадлежности к группе? И не совсем понимаю, какую функцию из двух брать? Ту, у которой выше значение Лямбды Уилкса и выше значимость? (если исходить из величины собственного значения функции: чем больше значение, тем лучше различение). Подзапуталась....

Также не совсем поняла фразу: "Полезно получить значения центроидов самостоятельно, сохранив значения дискриминирующих функций для каждого объекта выборки и сравнить их средние значения. Не забудьте только о стандартизации исходных переменных и использовании для расчета функций соответствующих коэффициентов. Качество дискриминации ( % ) посмотрите в таблице. Тогда поймете, что не всегда расчетная и реальная принадлежность к группе совпадает". Имеете в виду "сохранив значения дискриминирующих функций" - это через стат.программу кнопку "Сохранить" и в массиве данных появятся новые переменные Dis? Под стандартизацией Вы здесь имеете в виду приведение всех первичных показателей к единой единице измерения? "Использование расчета функций соответствующих коэффициентов" - это о применении нестандартизированных коэффициентов, которые подставляются в формулу перед значениями переменных?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 21.03.2018 - 11:49
Сообщение #4


Дух форума
*

Группа: Пользователи
Сообщений: 1318
Регистрация: 27.11.2007
Пользователь №: 4573



Вы не поняли. Я разделила на 2 не потому, что у вас было две группы, а чтобы показать, что между двумя числами имеется середина. Любое расчетное число для нового объекта вы сравниваете с этой срединой. Если вы получили расчетное число большее чем 0,423, то объект классифицируется во вторую группу, потому, что оно будет ближе к центроиду второго класса, чем первого.
Если у вас 3 группы, все для вас будет еще сложнее. Центроиды у вас расположены не на линии, а на плоскости и имеют по две координаты (первые две канонические функции), реже больше. Вы можете получить график всех объектов выборки и нанести значения центроидов трех ваших групп. Расстояние между центроидами будут выражаться разностью координат.
Стандартизация - это базовое понятие и стандартная процедура в любом стат пакете.

Сообщение отредактировал DrgLena - 21.03.2018 - 11:50
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 21.03.2018 - 12:51
Сообщение #5


Дух форума
*

Группа: Пользователи
Сообщений: 659
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(tvsova80 @ 20.03.2018 - 12:12) *
Спасибо.
Могли бы Вы мне еще подсказать информацию по дискриминантному анализу: есть 3 группы - эффективные, менее эффективные, средние. Также обработали их дискриминантным анализом, получили 2 функции и для каждой функции свои нестандартизированные коэффициенты и константу, а также свои центроиды. Следовательно, формула сложить полученные центроиды и разделить на 2 (количество групп) здесь "не работает", так как группы не равные. Каким образом здесь возможно определить порог принадлежности к группе? И не совсем понимаю, какую функцию из двух брать? Ту, у которой выше значение Лямбды Уилкса и выше значимость? (если исходить из величины собственного значения функции: чем больше значение, тем лучше различение). Подзапуталась....


>tvsova80, ознакомьтесь с вот этим. Реальная классификация (в т.ч. и в стат. пакетах) идет по классифицирующим функциям (21) в тексте по ссылке.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
tvsova80
сообщение 21.03.2018 - 17:01
Сообщение #6


Дух форума
*

Группа: Пользователи
Сообщений: 6
Регистрация: 19.10.2017
Пользователь №: 30388



Цитата(DrgLena @ 21.03.2018 - 11:49) *
Вы не поняли. Я разделила на 2 не потому, что у вас было две группы, а чтобы показать, что между двумя числами имеется середина. Любое расчетное число для нового объекта вы сравниваете с этой срединой. Если вы получили расчетное число большее чем 0,423, то объект классифицируется во вторую группу, потому, что оно будет ближе к центроиду второго класса, чем первого.
Если у вас 3 группы, все для вас будет еще сложнее. Центроиды у вас расположены не на линии, а на плоскости и имеют по две координаты (первые две канонические функции), реже больше. Вы можете получить график всех объектов выборки и нанести значения центроидов трех ваших групп. Расстояние между центроидами будут выражаться разностью координат.
Стандартизация - это базовое понятие и стандартная процедура в любом стат пакете.



Спасибо. Подскажите, пожалуйста, есть ли какой-либо "живой" пример по этому, где можно посмотреть? В Интернете не могу найти видеоуроки по дискриминантному анализу в SPSS, только в Statistica. Имею в виду как определиться с "порогом" для 3 групп? Чтобы было четко прописано по шагам: шаг 1- берм вот это и делаем это, получаем это..... шаг 2- ...., и т.д. Чтобы было совсем понятно? Без примеров сложно.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
tvsova80
сообщение 21.03.2018 - 17:11
Сообщение #7


Дух форума
*

Группа: Пользователи
Сообщений: 6
Регистрация: 19.10.2017
Пользователь №: 30388



Цитата(100$ @ 21.03.2018 - 12:51) *
>tvsova80, ознакомьтесь с вот этим. Реальная классификация (в т.ч. и в стат. пакетах) идет по классифицирующим функциям (21) в тексте по ссылке.



Спасибо. Да, знаю такую функцию, получается при подстановке нестандартизированных коэффициентов тех показателей, которые получились плюс константа при использовании стат.пакета. Правильно понимаю? Здесь я не могу понять до конца, от какого значения отталкиваться при подстановке в уравнение реальных значений какого-либо обследованного, чтобы понять, к какой группе его отнести (эффективных, менее эффективных, средних), так как выводящаяся таблица с центроидами групп - это не те значения на которые стоит ориентироваться. Правильно? Так как центроиды - это средние. Поэтому - какое значение является "начальным" для отнесения к группы эффективных, какое - для группы менее эффективных, а какое для средних. Правильно понимаю, что при определении мы используем полученные значения для 2-х функций (так как группы 3)? Здесь я тоже что-то запуталась.....

Можно где-либо посмотреть или почитать как это происходит по шагам, например, шаг 1 - взяли это, получили это, шаг 2- .... и т.д.?


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 21.03.2018 - 17:46
Сообщение #8


Дух форума
*

Группа: Пользователи
Сообщений: 659
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(tvsova80 @ 21.03.2018 - 17:11) *
Спасибо. Да, знаю такую функцию, получается при подстановке нестандартизированных коэффициентов тех показателей, которые получились плюс константа при использовании стат.пакета. Правильно понимаю? Здесь я не могу понять до конца, от какого значения отталкиваться при подстановке в уравнение реальных значений какого-либо обследованного, чтобы понять, к какой группе его отнести (эффективных, менее эффективных, средних), так как выводящаяся таблица с центроидами групп - это не те значения на которые стоит ориентироваться. Правильно? Так как центроиды - это средние. Поэтому - какое значение является "начальным" для отнесения к группы эффективных, какое - для группы менее эффективных, а какое для средних. Правильно понимаю, что при определении мы используем полученные значения для 2-х функций (так как группы 3)? Здесь я тоже что-то запуталась.....

Можно где-либо посмотреть или почитать как это происходит по шагам, например, шаг 1 - взяли это, получили это, шаг 2- .... и т.д.?


Прочитайте текст по ссылке. Там содержатся ответы на все вопросы. Из него вы узнаете, что для (трех/много)классовой классификации нет никаких "пороговых значений", а есть
1. простые классифицирующие функции (21)
2. расстояния Махаланобиса (26-28)
3. вероятности (апостериорные) отнесения объекта к тому или иному классу.

Как это работает? А очень просто. Для простых классифицирующих функций вы трижды подставляете в (21) значения х- входное признаковое описание классифицируемого объекта; pooled-матрица внутриклассовой ковариации (сигма) всегда одна и та же для всех классов, каждый центроид - уникален (свой) для каждого из классов. Т.о. получили три различных значения. Если наибольшее значение получено для 1-й к.ф. (т.е. с использованием центроида 1-го класса), то относим объект к 1-му классу, если для 2-го, то относим ко второму, если для третьего-то...

То же и для расстояния Махаланобиса: признаковое описание объекта -уникальное, центроиды классов - уникальные, матрица -одна на всех. Опять получили три разных значения. Объект относится к тому классу, для которого расстояние Махаланобиса - наименьшее. Оно же соответствует наибольшей апостериорной плотности.

Сообщение отредактировал 100$ - 21.03.2018 - 17:52
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему