Цитата(riba4kasonja @ 5.01.2013 - 00:53)

Спасибо, а когда применяют корреляционные коэффициенты?
Коллега riba4kasonja!
Существуют более 10 видов коэффициентов корреляции. Поэтому и здесь следует уточнять о каких конкретно коэффициента Вы спрашиваете. Почитайте прекрасную книгу Фёрстера и Рёнца "Методы корреляционного и регрессионного анализа", и там найдёте многие ответы. Применительно же к Вашим данным можно говорить о корреляции (взаимосвязи) между двумя качественными признаками. Ниже привожу полученные по моей просьбе результаты детального анализа Вашей таблицы:
Statistics for Table of A by B
Statistic DF Value Prob
------------------------------------------------------
Chi-Square 1 13.1815 0.0003
Likelihood Ratio Chi-Square 1 12.7813 0.0004
Continuity Adj. Chi-Square 1 11.0223 0.0009
Mantel-Haenszel Chi-Square 1 12.9755 0.0003
Phi Coefficient 0.4538
Contingency Coefficient 0.4133
Cramer's V 0.4538
Здесь 3 последних показателя как раз и отражают интенсивность связи двух качественных признаков. Это Фи-коэффициент, коэффициент контингенции, и коэффициент Крамера. Рекомендую использовать именно его.
Кроме этих 3-х показателей интенсивности связи есть немало и других. Ниже привожу ещё одну таблицу с такими показателями:
Statistic Value ASE
------------------------------------------------------
Gamma 0.8095 0.1166
Kendall's Tau-b 0.4538 0.1184
Stuart's Tau-c 0.3652 0.1087
Somers' D C|R 0.4048 0.1158
Somers' D R|C 0.5088 0.1288
Pearson Correlation 0.4538 0.1184
Spearman Correlation 0.4538 0.1184
Lambda Asymmetric C|R 0.0000 0.3127
Lambda Asymmetric R|C 0.3182 0.1454
Lambda Symmetric 0.1892 0.1914
Uncertainty Coefficient C|R 0.1834 0.0957
Uncertainty Coefficient R|C 0.1552 0.0835
Uncertainty Coefficient Symmetric 0.1681 0.0888
Эти показатели хорошо описаны в книге Афифи и Эйзена.
Теперь относительно результатов проведения точного анализа по Фишеру. Ниже привожу результаты с использованием метода Монте-Карло с объёмом выборок в 10 млн.
Monte Carlo Estimate for the Exact Test
Pr >= ChiSq 5.544E-04
99% Lower Conf Limit 5.352E-04
99% Upper Conf Limit 5.736E-04
Number of Samples 10000000
Вывод: существует СТАТИСТИЧЕСКИ ЗНАЧИМАЯ взаимосвязь двух изучаемых качественных признаков.
Более глубокий анализ этих результатов требует вникания и в другие показатели. Вот, к примеру, оценки относительных рисков:
Estimates of the Relative Risk (Row1/Row2)
Type of Study Value 95% Confidence Limits
-----------------------------------------------------------------
Case-Control (Odds Ratio) 9.5000 2.5211 35.7985
Cohort (Col1 Risk) 5.2500 1.8902 14.5815
Cohort (Col2 Risk) 0.5526 0.3598 0.8489
Видим, что значения относительных рисков для разных колонок разные. В частности, максимальный вклад в эту зависимость вносит первая колонка. Тогда как вторая колонка вносит гораздо меньший вклад. Чтобы понять смысл этих различий, необходимо понимать ВСЮ ПРОЦЕДУРУ вычисления этих статистик. Вот тогда и станет ясно, в каких клетках положительная связь, а в каких - отрицательная.
Вывод: необходимо учиться, если действительно желаете извлечь ценную и полезную информацию. В противном случае всё то, что напишите далее с помощью участников форума, будет лишь создавать видимость знания.
Кстати, один из аспектов Вашего исследования вообще остался "за бортом". Ведь у всех пациентов помимо фиксации 2-х признаков есть и показатели по анамнезу. И тогда встаёт вопрос об использовании многомерных методов. Которые и помогут выяснить детали того, почему такова реакция организма.
Желаю успешного овладения знаниями в этой области.