Коэффициенты корреляции (ассоциации), когда и какой использовать |
Здравствуйте, гость ( Вход | Регистрация )
Коэффициенты корреляции (ассоциации), когда и какой использовать |
12.04.2010 - 14:27
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 6.02.2010 Из: Клайпеда Пользователь №: 10967 |
Уважаемые коллеги! Возник такой вопрос: для изучения силы статистической связи между изучаемыми признаками используются различные коэффициенты (Спирмена, Юла (Q),контингенции (Ф), Пирсона (С), Чупрова (К) и т.д.)- подскажите пожалуйста, есть ли какие-то ограничения на применение этих коэффициентов в зависимости от характера данных.
В книге В.М. Зайцева В.М. "Прикладная медицинская статистика" ( Фолиант-2003) приводятся такие данные: к. Спирмена- для анализа связи между количественными и качественными признаками, или только качественными;также если распределение учетных признаков (в т.ч. и количеств.) не соответствует нормальному или неизвестно.к.Юла и Ф используются для оценки взаимосвязи между любыми признаками сведенными в четырехклеточную таблицу сопряженности (тот же источник). Там же написано, что коэффициенты сопряженности Пирсона и Чупрова применяются для анализа взаимосвязи между количественными признаками. В то же время на сайте statsoft.ru указано, что коэффициент сопряженности (?Пирсона???- наверное, на сайте не указано) применяется для анализа связи между качественными признаками. Такая же трактовка приведена в книге Малета Ю.С., Тарасов В.В. "Непараметрические методы статистич. анализа в биологии и медицине" (МГУ-1982) стр.157. У Зайцева Г.Н. "Математика в экспериментальной ботанике" (Наука-1990) для анализа связи между качественными признаками предлагается использовать полихорический или тетрахорический( для 4-х польных таблиц) коэффициент Чупрова. У О.Ю. Ребровой написано что к.Пирсона-для нормально распределенных количественных данных. Вопрос возник в связи с тем, что нет однозначной трактовки когда (при каком типе данных) какой из коэффициентов применять. Существует ли для каждого из этих коэффициентов шкала, по которой определяется сила связи, или достаточно использовать приведенную в книге Ребровой О.Ю. на стр.185. Cogito ergo sum
Nemo omnia potest scire |
|
14.04.2010 - 18:54
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Уважаемые коллеги! Возник такой вопрос: для изучения силы статистической связи между изучаемыми признаками используются различные коэффициенты (Спирмена, Юла (Q),контингенции (Ф), Пирсона (С), Чупрова (К) и т.д.)- подскажите пожалуйста, есть ли какие-то ограничения на применение этих коэффициентов в зависимости от характера данных. ... Существует ли для каждого из этих коэффициентов шкала, по которой определяется сила связи, или достаточно использовать приведенную в книге Ребровой О.Ю. на стр.185. Мер корреляции/ассоциации предложено очень много и, конечно, они имеют свои ограничения. У меня нет хорошей развёрнутой таблицы (надо бы составить), а студентам даю такой упрощённый вариант: в таблице 3 х 3 по горизонтали характеристики x1 - количественная, порядковая, качественная дихотомическая, по вертикали такие же характеристики x2. На пересечения в верхнем треугольнике заносим методы. "Количественная - количественная (обе с нормальным распределением)" - Корреляция Пирсона "Количественная - порядковая" - бисериальная корреляция "Количественная - качественная дихотомическая" - точечно-бисериальная корреляция "Порядковая - порядковая" - ранговые корреляции Спирмена, Кенделла (тау), полихорическая корреляция и др. "Порядковая - качественная дихотомическая" - рангово-бисериальная корреляция и меры ассоциации "Качественная дихотомическая - качественная дихотомическая" - меры ассоциации (Юла, Гамма, Фи и др.), отношение шансов. Вариант упрощённый, т.к. очень грубый и даже не совсем верный. Например, корреляции ро Спирмена и тау Кенделла хотя и являются ранговыми, предполагают, что в основе рангов лежит непрерывная переменная (неважно как распределённая), а полихорическая корреляция более того требует в основе рангов аж двумерного нормального распределения. Меры ассоциации есть (1) симметричные и асимметричные, (2) варьирующие в пределах "0 - 1", "-1 - +1", в других пределах, (3) самостоятельные или варианты более общих мер для частного случая - таблиц 2 х 2. Лучший из известных мне ресурсов, где описаны требования практически всех известных методов оценки связи: http://faculty.chass.ncsu.edu/garson/PA765/statnote.htm Материала много, нужно смотреть и Association, и Correlation, и ещё уходить по внутренним ссылкам. На этом форуме обсуждалась точечно-бисериальная корреляция: http://forum.disser.ru/index.php?showtopic...amp;hl=biserial . Для мер, варьирующих в пределах "-1 - +1" интерпретация одинакова. Можно найти более развёрнутые чем у Ребровой качественные характеристики силы связи на основе их количественной оценки. Сообщение отредактировал nokh - 14.04.2010 - 18:59 |
|
14.04.2010 - 19:28
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Случаи однородных и разнородных признаков упомянуты почти все.
Еще бы добавил коэффициент Гауэра - для смешанных признаков. Т.е. с помощью данного метода могут анализироваться выборки, содержащие часть признаков количественных, часть - порядковых, часть - дихотомических. Такой вот интересный метод. Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
16.04.2010 - 14:20
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 6.02.2010 Из: Клайпеда Пользователь №: 10967 |
Большое спасибо за развернутый ответ. Буду разбираться со всем этим многообразием.
Cogito ergo sum
Nemo omnia potest scire |
|
21.05.2010 - 08:49
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 6.02.2010 Из: Клайпеда Пользователь №: 10967 |
Имеются ли какие-либо ограничения по количеству наблюдений на применение коэф. Спирмена. В литературе и в интернете несколько раз встречал, что объем выборки не должен быть более 30 наблюдений. В некоторых источниках вообще не указывается никаких ограничений.
Но вот нашел статью в которой анализируют выборку в 182 пациента и оценивают корреляцию с использованием коэф. Спирмена http://www.mediasphera.ru/journals/akuvest/detail/90/880/ И как выполнить корреляционный анализ в АттеСтате - посмотрел помощь, но далек от понимания как вводить данные, если можно поясните на примере (если нужно могу прислать кусок матрицы). Cogito ergo sum
Nemo omnia potest scire |
|
26.05.2010 - 20:40
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Имеются ли какие-либо ограничения по количеству наблюдений на применение коэф. Спирмена. В литературе и в интернете несколько раз встречал, что объем выборки не должен быть более 30 наблюдений. Чушь! Для любого метода чем больше выборка, тем лучше. Некоторые методы при увеличении выборки теряют в мощности (например, критерий знаков), но это вовсе не означает, что для больших выборок они неприменимы. Думаю, байка родилась из того, что в таблицах критических значений для критерия Спирмена не приводят более 30 значений, т.к. для больших выборок используется нормальная аппроксимация. И как выполнить корреляционный анализ в АттеСтате - посмотрел помощь, но далек от понимания как вводить данные, если можно поясните на примере (если нужно могу прислать кусок матрицы). Отметить галочкой Спирмена. В первой строке задать выделением область значений первого признака в первом столбце, во второй - второго признака во втором столбце. В третьей строке задат ячейку вывода результатов. В последней версии (12.1.7) модуль корреляционного анализа был доработан, но на моём компе глючит: первый раз AtteStat не подгружается к Excel, а после принудительного завершения процесса при второй попытке загружаться без модуля корреляционного анализа. Нужно будет ещё на работе попробовать - там винда лицензионная, а не сборка:). |
|