Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Корреляционное исследование

Автор: Choledochus 1.02.2019 - 13:07

Уважаемые знатоки, пожалуйста ответьте на вопрос.
Я провел корр. исследование между двумя выборками (АД-ИМТ, индекс массы тела). По коэффициенту корреляции определил, что сила связи слабая (это меня не устраивает).
Тогда я разбил выборки по категориям (на 5 групп по индексу массы тела) и повторил исследование в отдельных группах. Обнаружил в группе с ожирением сильную связь.
Можно ли так представить результаты и как их интерпретировать ситуацию, что связь между целыми выборками слабая, а в категориях по-разному?
Вот так можно (?):
"Последнее может интерпретироваться как ложное снижение корреляции вследствие неоднородности данных, вызванной принадлежностью опрошенных к разным категориям индивидуумов или как нелинейная корреляционная связь".
Спасибо!

Автор: nokh 1.02.2019 - 13:48

Цитата(Choledochus @ 1.02.2019 - 15:07) *
... Вот так можно (?):
"Последнее может интерпретироваться как ложное снижение корреляции вследствие неоднородности данных, вызванной принадлежностью опрошенных к разным категориям индивидуумов или как нелинейная корреляционная связь".

Полагаю, что можно. Звучит тоже нормально: лаконично, для меня - понятно. Когда мы анализируем связи в большой неоднородной группе, то можем сделать выводы с точностью до наоборот. Это - парадокс Симпсона, см. рисунок в этой теме: http://forum.disser.ru/index.php?showtopic=1998

Автор: Choledochus 1.02.2019 - 15:41

Спасибо за ответ и ссылку!!!

Автор: Med_Elena 17.02.2019 - 09:43

Цитата(Choledochus @ 1.02.2019 - 13:07) *
Уважаемые знатоки, пожалуйста ответьте на вопрос.
Я провел корр. исследование между двумя выборками (АД-ИМТ, индекс массы тела). По коэффициенту корреляции определил, что сила связи слабая (это меня не устраивает).
Тогда я разбил выборки по категориям (на 5 групп по индексу массы тела) и повторил исследование в отдельных группах. Обнаружил в группе с ожирением сильную связь.
Можно ли так представить результаты и как их интерпретировать ситуацию, что связь между целыми выборками слабая, а в категориях по-разному?
Вот так можно (?):
"Последнее может интерпретироваться как ложное снижение корреляции вследствие неоднородности данных, вызванной принадлежностью опрошенных к разным категориям индивидуумов или как нелинейная корреляционная связь".
Спасибо!


Не рекомендую приводить подобные описания. Поскольку в них нет никакой конкретики. В частности не приводится корректное описание типа корреляционного анализа.
А этот анализ бывает разный, и не все их применения всегда корректны. Ну а если в базе данных есть группы наблюдений, то в этом случае продуктивно сравнивать
эти группы разными многомерными методами. Например, разными алгоритмами дискриминантного анализа, или разными алгоритмами логистической регрессии.
И тогда станет ясно, какие именно признаки доминируют в различии как между собой в этих группах, так и по интенсивности связи между собой. Естественно что
сделать такие анализы могут не все медики, поскольку это методы очень сложные, но зато очень продуктивные.

Автор: nokh 19.02.2019 - 08:06

Цитата(Med_Elena @ 17.02.2019 - 11:43) *
Не рекомендую приводить подобные описания. Поскольку в них нет никакой конкретики. В частности не приводится корректное описание типа корреляционного анализа.
А этот анализ бывает разный, и не все их применения всегда корректны. Ну а если в базе данных есть группы наблюдений, то в этом случае продуктивно сравнивать
эти группы разными многомерными методами. Например, разными алгоритмами дискриминантного анализа, или разными алгоритмами логистической регрессии.
И тогда станет ясно, какие именно признаки доминируют в различии как между собой в этих группах, так и по интенсивности связи между собой. Естественно что
сделать такие анализы могут не все медики, поскольку это методы очень сложные, но зато очень продуктивные.

Странная рекомендация. Если бы вы ознакомились с содержанием ветки по ссылке выше, то узнали бы, что парадокс объединений неразрешим в принципе. Даже с помощью многомерных техник. Даже если их применяют не медики, а (био)статистики. Кстати, логистическая регрессия, как и прочие варианты множественной регрессии с одним откликом, не относятся к многомерным методам.

Автор: salm 9.07.2022 - 14:56

Добрый день. Меня интересует оценка связи между двумя непрерывным переменными, с распределением отличным от нормального. Могу ли я довольствоваться коэффициентов Спирмена, или же ненужно попытаться эти данные нормализовать и пользовать параметрическим методом?.. Пока меня интересует только сила связи, и по Спирмену у одного из параметров связь с референтной переменной она 0,6 а другого - 0,7 (ну примерно).. может ли быть такое, что при "нормализации" один из параметров будет сильнее кореллировать с рефератным, чем другой? Или же хватит вполне непараметрического критерия?
Мы предполагали что связь сильнее будет у того из параметров, что показал слабее связь.
Спасибо

Автор: passant 9.07.2022 - 16:41

Цитата(salm @ 9.07.2022 - 14:56) *
Добрый день. Меня интересует оценка связи между двумя непрерывным переменными, с распределением отличным от нормального. Могу ли я довольствоваться коэффициентов Спирмена, или же ненужно попытаться эти данные нормализовать и пользовать параметрическим методом?.

Для чего?? Все же должно быть оправдано чем-то. Чем вам Спирмен не угодил?


Цитата(salm @ 9.07.2022 - 14:56) *
Мы предполагали что связь сильнее будет у того из параметров, что показал слабее связь.


Чего??? Коэффициент корреляции показывает силу связи. Чем больше значение (по абсолютной величине),тем сильнее связь. Но вот сама связь может быть положительной и отрицательной, и вот именно это показывает знак коэффициента.

Автор: salm 9.07.2022 - 17:44

Цитата(passant @ 9.07.2022 - 16:41) *
Для чего?? Все же должно быть оправдано чем-то. Чем вам Спирмен не угодил?

Всем угодил, спасибо. Просто удостовериться


Чего??? Коэффициент корреляции показывает силу связи. Чем больше значение (по абсолютной величине),тем сильнее связь. Но вот сама связь может быть положительной и отрицательной, и вот именно это показывает знак коэффициента.

Ясно. Спасибо. Я понимаю, что означает коэффициент короеляции и знак при нем. Я слышала как то, на конгрессе, докладчик сказал следующее: мы для оценки силы связи, пересчитали коэф корреляции, для этого мы связались со статистиками, и убедились в еще более тесной связи двух показателей, при этом про сам стат анализ он не уточнял
А моей коллеге порекомендовал статистик коэффициент корряции Пирсона ( в ее работе три коэффициента указаны, не помню какой том еще, Кэндал что ли.)., он ей преобразовал данные, логарифмируя их, и зачем то это вошло в ее работу. Ни о какой регрессии просто речь там не шла, поэтому я и спрашиваю,, это просто мои догадки были

Автор: ИНО 10.07.2022 - 17:00

Цитата(salm @ 9.07.2022 - 14:56) *
Мы предполагали что связь сильнее будет у того из параметров, что показал слабее связь.

Ну вот, начинается: найдите мне единственно правильный метод, который докажет, что наше предположение верно, а то перепробованные не хотят.

Что нужно сделать в первую очередь: посмотреть на диаграммы рассеяния.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)