Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Коэффициенты корреляции (ассоциации)
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Pyrosmani
Уважаемые коллеги! Возник такой вопрос: для изучения силы статистической связи между изучаемыми признаками используются различные коэффициенты (Спирмена, Юла (Q),контингенции (Ф), Пирсона (С), Чупрова (К) и т.д.)- подскажите пожалуйста, есть ли какие-то ограничения на применение этих коэффициентов в зависимости от характера данных.
В книге В.М. Зайцева В.М. "Прикладная медицинская статистика" ( Фолиант-2003) приводятся такие данные:
к. Спирмена- для анализа связи между количественными и качественными признаками, или только качественными;также если распределение учетных признаков (в т.ч. и количеств.) не соответствует нормальному или неизвестно.к.Юла и Ф используются для оценки взаимосвязи между любыми признаками сведенными в четырехклеточную таблицу сопряженности (тот же источник). Там же написано, что коэффициенты сопряженности Пирсона и Чупрова применяются для анализа взаимосвязи между количественными признаками.
В то же время на сайте statsoft.ru указано, что коэффициент сопряженности (?Пирсона???- наверное, на сайте не указано) применяется для анализа связи между качественными признаками.
Такая же трактовка приведена в книге Малета Ю.С., Тарасов В.В. "Непараметрические методы статистич. анализа в биологии и медицине" (МГУ-1982) стр.157.
У Зайцева Г.Н. "Математика в экспериментальной ботанике" (Наука-1990) для анализа связи между качественными признаками предлагается использовать полихорический или тетрахорический( для 4-х польных таблиц) коэффициент Чупрова. У О.Ю. Ребровой написано что к.Пирсона-для нормально распределенных количественных данных.

Вопрос возник в связи с тем, что нет однозначной трактовки когда (при каком типе данных) какой из коэффициентов применять.

Существует ли для каждого из этих коэффициентов шкала, по которой определяется сила связи, или достаточно использовать приведенную в книге Ребровой О.Ю. на стр.185.


nokh
Цитата(Pyrosmani @ 12.04.2010 - 17:27) *
Уважаемые коллеги! Возник такой вопрос: для изучения силы статистической связи между изучаемыми признаками используются различные коэффициенты (Спирмена, Юла (Q),контингенции (Ф), Пирсона (С), Чупрова (К) и т.д.)- подскажите пожалуйста, есть ли какие-то ограничения на применение этих коэффициентов в зависимости от характера данных. ...
Существует ли для каждого из этих коэффициентов шкала, по которой определяется сила связи, или достаточно использовать приведенную в книге Ребровой О.Ю. на стр.185.

Мер корреляции/ассоциации предложено очень много и, конечно, они имеют свои ограничения. У меня нет хорошей развёрнутой таблицы (надо бы составить), а студентам даю такой упрощённый вариант: в таблице 3 х 3 по горизонтали характеристики x1 - количественная, порядковая, качественная дихотомическая, по вертикали такие же характеристики x2. На пересечения в верхнем треугольнике заносим методы.

"Количественная - количественная (обе с нормальным распределением)" - Корреляция Пирсона
"Количественная - порядковая" - бисериальная корреляция
"Количественная - качественная дихотомическая" - точечно-бисериальная корреляция
"Порядковая - порядковая" - ранговые корреляции Спирмена, Кенделла (тау), полихорическая корреляция и др.
"Порядковая - качественная дихотомическая" - рангово-бисериальная корреляция и меры ассоциации
"Качественная дихотомическая - качественная дихотомическая" - меры ассоциации (Юла, Гамма, Фи и др.), отношение шансов.

Вариант упрощённый, т.к. очень грубый и даже не совсем верный. Например, корреляции ро Спирмена и тау Кенделла хотя и являются ранговыми, предполагают, что в основе рангов лежит непрерывная переменная (неважно как распределённая), а полихорическая корреляция более того требует в основе рангов аж двумерного нормального распределения. Меры ассоциации есть (1) симметричные и асимметричные, (2) варьирующие в пределах "0 - 1", "-1 - +1", в других пределах, (3) самостоятельные или варианты более общих мер для частного случая - таблиц 2 х 2. Лучший из известных мне ресурсов, где описаны требования практически всех известных методов оценки связи: http://faculty.chass.ncsu.edu/garson/PA765/statnote.htm Материала много, нужно смотреть и Association, и Correlation, и ещё уходить по внутренним ссылкам. На этом форуме обсуждалась точечно-бисериальная корреляция: http://forum.disser.ru/index.php?showtopic...amp;hl=biserial .

Для мер, варьирующих в пределах "-1 - +1" интерпретация одинакова. Можно найти более развёрнутые чем у Ребровой качественные характеристики силы связи на основе их количественной оценки.
Игорь
Случаи однородных и разнородных признаков упомянуты почти все.

Еще бы добавил коэффициент Гауэра - для смешанных признаков. Т.е. с помощью данного метода могут анализироваться выборки, содержащие часть признаков количественных, часть - порядковых, часть - дихотомических. Такой вот интересный метод.
Pyrosmani
Большое спасибо за развернутый ответ. Буду разбираться со всем этим многообразием.
Pyrosmani
Имеются ли какие-либо ограничения по количеству наблюдений на применение коэф. Спирмена. В литературе и в интернете несколько раз встречал, что объем выборки не должен быть более 30 наблюдений. В некоторых источниках вообще не указывается никаких ограничений.
Но вот нашел статью в которой анализируют выборку в 182 пациента и оценивают корреляцию с использованием коэф. Спирмена
http://www.mediasphera.ru/journals/akuvest/detail/90/880/

И как выполнить корреляционный анализ в АттеСтате - посмотрел помощь, но далек от понимания как вводить данные, если можно поясните на примере (если нужно могу прислать кусок матрицы).
nokh
Цитата(Pyrosmani @ 21.05.2010 - 11:49) *
Имеются ли какие-либо ограничения по количеству наблюдений на применение коэф. Спирмена. В литературе и в интернете несколько раз встречал, что объем выборки не должен быть более 30 наблюдений.

Чушь! Для любого метода чем больше выборка, тем лучше. Некоторые методы при увеличении выборки теряют в мощности (например, критерий знаков), но это вовсе не означает, что для больших выборок они неприменимы. Думаю, байка родилась из того, что в таблицах критических значений для критерия Спирмена не приводят более 30 значений, т.к. для больших выборок используется нормальная аппроксимация.
Цитата(Pyrosmani @ 21.05.2010 - 11:49) *
И как выполнить корреляционный анализ в АттеСтате - посмотрел помощь, но далек от понимания как вводить данные, если можно поясните на примере (если нужно могу прислать кусок матрицы).

Отметить галочкой Спирмена. В первой строке задать выделением область значений первого признака в первом столбце, во второй - второго признака во втором столбце. В третьей строке задат ячейку вывода результатов. В последней версии (12.1.7) модуль корреляционного анализа был доработан, но на моём компе глючит: первый раз AtteStat не подгружается к Excel, а после принудительного завершения процесса при второй попытке загружаться без модуля корреляционного анализа. Нужно будет ещё на работе попробовать - там винда лицензионная, а не сборка:).
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.