Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Коэффициенты корреляции (ассоциации), когда и какой использовать
Pyrosmani
сообщение 12.04.2010 - 14:27
Сообщение #1





Группа: Пользователи
Сообщений: 94
Регистрация: 6.02.2010
Из: Клайпеда
Пользователь №: 10967



Уважаемые коллеги! Возник такой вопрос: для изучения силы статистической связи между изучаемыми признаками используются различные коэффициенты (Спирмена, Юла (Q),контингенции (Ф), Пирсона (С), Чупрова (К) и т.д.)- подскажите пожалуйста, есть ли какие-то ограничения на применение этих коэффициентов в зависимости от характера данных.
В книге В.М. Зайцева В.М. "Прикладная медицинская статистика" ( Фолиант-2003) приводятся такие данные:
к. Спирмена- для анализа связи между количественными и качественными признаками, или только качественными;также если распределение учетных признаков (в т.ч. и количеств.) не соответствует нормальному или неизвестно.к.Юла и Ф используются для оценки взаимосвязи между любыми признаками сведенными в четырехклеточную таблицу сопряженности (тот же источник). Там же написано, что коэффициенты сопряженности Пирсона и Чупрова применяются для анализа взаимосвязи между количественными признаками.
В то же время на сайте statsoft.ru указано, что коэффициент сопряженности (?Пирсона???- наверное, на сайте не указано) применяется для анализа связи между качественными признаками.
Такая же трактовка приведена в книге Малета Ю.С., Тарасов В.В. "Непараметрические методы статистич. анализа в биологии и медицине" (МГУ-1982) стр.157.
У Зайцева Г.Н. "Математика в экспериментальной ботанике" (Наука-1990) для анализа связи между качественными признаками предлагается использовать полихорический или тетрахорический( для 4-х польных таблиц) коэффициент Чупрова. У О.Ю. Ребровой написано что к.Пирсона-для нормально распределенных количественных данных.

Вопрос возник в связи с тем, что нет однозначной трактовки когда (при каком типе данных) какой из коэффициентов применять.

Существует ли для каждого из этих коэффициентов шкала, по которой определяется сила связи, или достаточно использовать приведенную в книге Ребровой О.Ю. на стр.185.




Signature
Cogito ergo sum
Nemo omnia potest scire
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 14.04.2010 - 18:54
Сообщение #2





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Pyrosmani @ 12.04.2010 - 17:27) *
Уважаемые коллеги! Возник такой вопрос: для изучения силы статистической связи между изучаемыми признаками используются различные коэффициенты (Спирмена, Юла (Q),контингенции (Ф), Пирсона (С), Чупрова (К) и т.д.)- подскажите пожалуйста, есть ли какие-то ограничения на применение этих коэффициентов в зависимости от характера данных. ...
Существует ли для каждого из этих коэффициентов шкала, по которой определяется сила связи, или достаточно использовать приведенную в книге Ребровой О.Ю. на стр.185.

Мер корреляции/ассоциации предложено очень много и, конечно, они имеют свои ограничения. У меня нет хорошей развёрнутой таблицы (надо бы составить), а студентам даю такой упрощённый вариант: в таблице 3 х 3 по горизонтали характеристики x1 - количественная, порядковая, качественная дихотомическая, по вертикали такие же характеристики x2. На пересечения в верхнем треугольнике заносим методы.

"Количественная - количественная (обе с нормальным распределением)" - Корреляция Пирсона
"Количественная - порядковая" - бисериальная корреляция
"Количественная - качественная дихотомическая" - точечно-бисериальная корреляция
"Порядковая - порядковая" - ранговые корреляции Спирмена, Кенделла (тау), полихорическая корреляция и др.
"Порядковая - качественная дихотомическая" - рангово-бисериальная корреляция и меры ассоциации
"Качественная дихотомическая - качественная дихотомическая" - меры ассоциации (Юла, Гамма, Фи и др.), отношение шансов.

Вариант упрощённый, т.к. очень грубый и даже не совсем верный. Например, корреляции ро Спирмена и тау Кенделла хотя и являются ранговыми, предполагают, что в основе рангов лежит непрерывная переменная (неважно как распределённая), а полихорическая корреляция более того требует в основе рангов аж двумерного нормального распределения. Меры ассоциации есть (1) симметричные и асимметричные, (2) варьирующие в пределах "0 - 1", "-1 - +1", в других пределах, (3) самостоятельные или варианты более общих мер для частного случая - таблиц 2 х 2. Лучший из известных мне ресурсов, где описаны требования практически всех известных методов оценки связи: http://faculty.chass.ncsu.edu/garson/PA765/statnote.htm Материала много, нужно смотреть и Association, и Correlation, и ещё уходить по внутренним ссылкам. На этом форуме обсуждалась точечно-бисериальная корреляция: http://forum.disser.ru/index.php?showtopic...amp;hl=biserial .

Для мер, варьирующих в пределах "-1 - +1" интерпретация одинакова. Можно найти более развёрнутые чем у Ребровой качественные характеристики силы связи на основе их количественной оценки.

Сообщение отредактировал nokh - 14.04.2010 - 18:59
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 14.04.2010 - 19:28
Сообщение #3





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Случаи однородных и разнородных признаков упомянуты почти все.

Еще бы добавил коэффициент Гауэра - для смешанных признаков. Т.е. с помощью данного метода могут анализироваться выборки, содержащие часть признаков количественных, часть - порядковых, часть - дихотомических. Такой вот интересный метод.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pyrosmani
сообщение 16.04.2010 - 14:20
Сообщение #4





Группа: Пользователи
Сообщений: 94
Регистрация: 6.02.2010
Из: Клайпеда
Пользователь №: 10967



Большое спасибо за развернутый ответ. Буду разбираться со всем этим многообразием.


Signature
Cogito ergo sum
Nemo omnia potest scire
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pyrosmani
сообщение 21.05.2010 - 08:49
Сообщение #5





Группа: Пользователи
Сообщений: 94
Регистрация: 6.02.2010
Из: Клайпеда
Пользователь №: 10967



Имеются ли какие-либо ограничения по количеству наблюдений на применение коэф. Спирмена. В литературе и в интернете несколько раз встречал, что объем выборки не должен быть более 30 наблюдений. В некоторых источниках вообще не указывается никаких ограничений.
Но вот нашел статью в которой анализируют выборку в 182 пациента и оценивают корреляцию с использованием коэф. Спирмена
http://www.mediasphera.ru/journals/akuvest/detail/90/880/

И как выполнить корреляционный анализ в АттеСтате - посмотрел помощь, но далек от понимания как вводить данные, если можно поясните на примере (если нужно могу прислать кусок матрицы).


Signature
Cogito ergo sum
Nemo omnia potest scire
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 26.05.2010 - 20:40
Сообщение #6





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Pyrosmani @ 21.05.2010 - 11:49) *
Имеются ли какие-либо ограничения по количеству наблюдений на применение коэф. Спирмена. В литературе и в интернете несколько раз встречал, что объем выборки не должен быть более 30 наблюдений.

Чушь! Для любого метода чем больше выборка, тем лучше. Некоторые методы при увеличении выборки теряют в мощности (например, критерий знаков), но это вовсе не означает, что для больших выборок они неприменимы. Думаю, байка родилась из того, что в таблицах критических значений для критерия Спирмена не приводят более 30 значений, т.к. для больших выборок используется нормальная аппроксимация.
Цитата(Pyrosmani @ 21.05.2010 - 11:49) *
И как выполнить корреляционный анализ в АттеСтате - посмотрел помощь, но далек от понимания как вводить данные, если можно поясните на примере (если нужно могу прислать кусок матрицы).

Отметить галочкой Спирмена. В первой строке задать выделением область значений первого признака в первом столбце, во второй - второго признака во втором столбце. В третьей строке задат ячейку вывода результатов. В последней версии (12.1.7) модуль корреляционного анализа был доработан, но на моём компе глючит: первый раз AtteStat не подгружается к Excel, а после принудительного завершения процесса при второй попытке загружаться без модуля корреляционного анализа. Нужно будет ещё на работе попробовать - там винда лицензионная, а не сборка:).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему