Анализ связи двух признаков |
Здравствуйте, гость ( Вход | Регистрация )
Анализ связи двух признаков |
11.11.2008 - 23:26
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 11.11.2008 Пользователь №: 5514 |
Уважаемые знатоки, подскажите пожалуйста как можно провести анализ связи двух признаков если один из них относится к количественному дискретному, а другой является качественным бинарным? Можно ли использовать метод Спирмена?
|
|
12.11.2008 - 00:30
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Уважаемые знатоки, подскажите пожалуйста как можно провести анализ связи двух признаков если один из них относится к количественному дискретному, а другой является качественным бинарным? Можно ли использовать метод Спирмена? Точечно-бисериальный коэффициент корреляции |
|
12.11.2008 - 11:10
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
как можно провести анализ связи двух признаков? Качественный бинарный признак - это тоже самое, что и количественный дискретный признак, принимающий два значения: 0 и 1. Бинарный признак нельзя считать распределенным нормально, поэтому вместо коэффициента корреляции Пирсона нужно использовать ранговый коэффициент корреляции Спирмена. Просто включи мозги => http://doctorstat.narod.ru
|
|
12.11.2008 - 12:36
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Качественный бинарный признак - это тоже самое, что и количественный дискретный признак, принимающий два значения: 0 и 1. Бинарный признак нельзя считать распределенным нормально, поэтому вместо коэффициента корреляции Пирсона нужно использовать ранговый коэффициент корреляции Спирмена. Это не то же самое. Это - качественный признак, измеренный при помощи номинальной шкалы (чаще всего). Количественный признак по определению не может принимать только два значения. Коэффициент корреляции Спирмена предназначен для переменных, имеющих порядковые значения, что для бинарных переменных возможно, но является натяжкой. Кроме того, использование коэффициента Спирмана теряет информацию о значениях второй - количественной -переменной. Поэтому надо использовать специализированные показатели - точечно-бисериальный коэффициент корреляции. |
|
12.11.2008 - 13:30
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
А всегда ли для оценки связи двух признаков подразумевается необходимость предоставить именно коэффициент корреляции? Если один признак бинарный, то не обязательно это будет "0" или"1". Это может быть овца и корова, тогда можно начать с того, что посмотреть на гистограмму распределения другой величины у овцы и коровы. После чего появится мысль о том, как эта связь может быть оценена. Может корова дает больше молока, а может у овцы чаще мочеиспускание.
|
|
12.11.2008 - 14:38
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 11.11.2008 Пользователь №: 5514 |
Цитата Поэтому надо использовать специализированные показатели - точечно-бисериальный коэффициент корреляции. Уважаемый Плав! А где можно найти прогу с расчетом этого критерия? в статистике 6.0 его нет помоему.. С благодарностью и уважением!
|
|
12.11.2008 - 15:16
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Программа AtteStat говорит, что это может посчитать, но почитайте условия для дихотомической переменной, она должна иметь два уровня (больше-меньше), а не быть чисто номинальной коровой и овцой.
|
|
12.11.2008 - 15:54
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Поэтому надо использовать специализированные показатели - точечно-бисериальный коэффициент корреляции. Уважаемый Плав! А где можно найти прогу с расчетом этого критерия? в статистике 6.0 его нет помоему.. С благодарностью и уважением! Фокус в том, что точечно-бисериальный коэффициент корреляции равен коэффициенту корреляции Пирсона, если вторая переменная дихотомическая (т.е. закодирована любыми двумя цифрами). (Psychological Statistics, Fourth Edition by Quinn McNemar (стр. 218), http://support.sas.com/techsup/unotes/V6/3/3956.html, http://ssc.utexas.edu/consulting/answers/general/gen5.html). Для расчета существуют специальные формулы, которые облегчают жизнь при ручных расчетах (детали тут http://en.wikipedia.org/wiki/Point-biseria...on_coefficient). Надо только внимательно подумать, как распределена вторая переменная (которая не бинарная). |
|
12.11.2008 - 16:18
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Здесь есть калькулятор, правда неудобный. Нужно самому сортировать значения для 0 и 1, менять десятичную запятую на точку и проследить чтобы после последней цифры не было нажато "Enter": http://faculty.vassar.edu/lowry/pbcorr.html . Результат расчетов совпадает с обычной корреляцией Пирсона, как везде и написано. В Attestat для этих двух корреляций результаты почему-то не совпадают + для ТБК нет оценки стат. значимости.
Сообщение отредактировал nokh - 12.11.2008 - 16:21 |
|
12.11.2008 - 21:18
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 11.11.2008 Пользователь №: 5514 |
СПАСИБО ОГРОМНОЕ!
|
|
13.11.2008 - 07:12
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
... В Attestat для этих двух корреляций результаты почему-то не совпадают + для ТБК нет оценки стат. значимости. Результаты могут не совпадать, потому что оценки дисперсии считаются по-разному (делится либо на n, либо на n-1). В данной плав-ом ссылке на Википедию показано, как данная проблема обходится. Сейчас замечено, что в AtteStat все совпадает и значимость считается. Впрочем, совпадение Пирсона и точечно-бисериального коэффициента касается также и значимости, и ДИ. Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
11.05.2012 - 18:12
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 60 Регистрация: 2.05.2012 Из: москва Пользователь №: 23730 |
насколько можно верить калькулятору? как его указать в данных? графически? интерпретация рпб? как у пирсона?
у меня получилось +0,28 в калькуляторе, то же самое по Пирсону. в принципе логичная положительная корреляция слабая между нахождением в реанимации и уровнем осложнений. |
|