Корреляционное исследование |
Здравствуйте, гость ( Вход | Регистрация )
Корреляционное исследование |
1.02.2019 - 13:07
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 97 Регистрация: 14.03.2006 Из: Москва Пользователь №: 870 |
Уважаемые знатоки, пожалуйста ответьте на вопрос.
Я провел корр. исследование между двумя выборками (АД-ИМТ, индекс массы тела). По коэффициенту корреляции определил, что сила связи слабая (это меня не устраивает). Тогда я разбил выборки по категориям (на 5 групп по индексу массы тела) и повторил исследование в отдельных группах. Обнаружил в группе с ожирением сильную связь. Можно ли так представить результаты и как их интерпретировать ситуацию, что связь между целыми выборками слабая, а в категориях по-разному? Вот так можно (?): "Последнее может интерпретироваться как ложное снижение корреляции вследствие неоднородности данных, вызванной принадлежностью опрошенных к разным категориям индивидуумов или как нелинейная корреляционная связь". Спасибо! Сообщение отредактировал Choledochus - 1.02.2019 - 13:09 |
|
1.02.2019 - 13:48
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
... Вот так можно (?): "Последнее может интерпретироваться как ложное снижение корреляции вследствие неоднородности данных, вызванной принадлежностью опрошенных к разным категориям индивидуумов или как нелинейная корреляционная связь". Полагаю, что можно. Звучит тоже нормально: лаконично, для меня - понятно. Когда мы анализируем связи в большой неоднородной группе, то можем сделать выводы с точностью до наоборот. Это - парадокс Симпсона, см. рисунок в этой теме: http://forum.disser.ru/index.php?showtopic=1998 |
|
1.02.2019 - 15:41
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 97 Регистрация: 14.03.2006 Из: Москва Пользователь №: 870 |
Спасибо за ответ и ссылку!!!
|
|
17.02.2019 - 09:43
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 9 Регистрация: 13.02.2019 Пользователь №: 32925 |
Уважаемые знатоки, пожалуйста ответьте на вопрос. Я провел корр. исследование между двумя выборками (АД-ИМТ, индекс массы тела). По коэффициенту корреляции определил, что сила связи слабая (это меня не устраивает). Тогда я разбил выборки по категориям (на 5 групп по индексу массы тела) и повторил исследование в отдельных группах. Обнаружил в группе с ожирением сильную связь. Можно ли так представить результаты и как их интерпретировать ситуацию, что связь между целыми выборками слабая, а в категориях по-разному? Вот так можно (?): "Последнее может интерпретироваться как ложное снижение корреляции вследствие неоднородности данных, вызванной принадлежностью опрошенных к разным категориям индивидуумов или как нелинейная корреляционная связь". Спасибо! Не рекомендую приводить подобные описания. Поскольку в них нет никакой конкретики. В частности не приводится корректное описание типа корреляционного анализа. А этот анализ бывает разный, и не все их применения всегда корректны. Ну а если в базе данных есть группы наблюдений, то в этом случае продуктивно сравнивать эти группы разными многомерными методами. Например, разными алгоритмами дискриминантного анализа, или разными алгоритмами логистической регрессии. И тогда станет ясно, какие именно признаки доминируют в различии как между собой в этих группах, так и по интенсивности связи между собой. Естественно что сделать такие анализы могут не все медики, поскольку это методы очень сложные, но зато очень продуктивные. |
|
19.02.2019 - 08:06
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Не рекомендую приводить подобные описания. Поскольку в них нет никакой конкретики. В частности не приводится корректное описание типа корреляционного анализа. А этот анализ бывает разный, и не все их применения всегда корректны. Ну а если в базе данных есть группы наблюдений, то в этом случае продуктивно сравнивать эти группы разными многомерными методами. Например, разными алгоритмами дискриминантного анализа, или разными алгоритмами логистической регрессии. И тогда станет ясно, какие именно признаки доминируют в различии как между собой в этих группах, так и по интенсивности связи между собой. Естественно что сделать такие анализы могут не все медики, поскольку это методы очень сложные, но зато очень продуктивные. Странная рекомендация. Если бы вы ознакомились с содержанием ветки по ссылке выше, то узнали бы, что парадокс объединений неразрешим в принципе. Даже с помощью многомерных техник. Даже если их применяют не медики, а (био)статистики. Кстати, логистическая регрессия, как и прочие варианты множественной регрессии с одним откликом, не относятся к многомерным методам. |
|
9.07.2022 - 14:56
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 62 Регистрация: 6.12.2021 Пользователь №: 39615 |
Добрый день. Меня интересует оценка связи между двумя непрерывным переменными, с распределением отличным от нормального. Могу ли я довольствоваться коэффициентов Спирмена, или же ненужно попытаться эти данные нормализовать и пользовать параметрическим методом?.. Пока меня интересует только сила связи, и по Спирмену у одного из параметров связь с референтной переменной она 0,6 а другого - 0,7 (ну примерно).. может ли быть такое, что при "нормализации" один из параметров будет сильнее кореллировать с рефератным, чем другой? Или же хватит вполне непараметрического критерия?
Мы предполагали что связь сильнее будет у того из параметров, что показал слабее связь. Спасибо Сообщение отредактировал salm - 9.07.2022 - 14:57 |
|
9.07.2022 - 16:41
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Добрый день. Меня интересует оценка связи между двумя непрерывным переменными, с распределением отличным от нормального. Могу ли я довольствоваться коэффициентов Спирмена, или же ненужно попытаться эти данные нормализовать и пользовать параметрическим методом?. Для чего?? Все же должно быть оправдано чем-то. Чем вам Спирмен не угодил? Мы предполагали что связь сильнее будет у того из параметров, что показал слабее связь. Чего??? Коэффициент корреляции показывает силу связи. Чем больше значение (по абсолютной величине),тем сильнее связь. Но вот сама связь может быть положительной и отрицательной, и вот именно это показывает знак коэффициента. Сообщение отредактировал passant - 9.07.2022 - 16:43 |
|
9.07.2022 - 17:44
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 62 Регистрация: 6.12.2021 Пользователь №: 39615 |
Для чего?? Все же должно быть оправдано чем-то. Чем вам Спирмен не угодил? Всем угодил, спасибо. Просто удостовериться Чего??? Коэффициент корреляции показывает силу связи. Чем больше значение (по абсолютной величине),тем сильнее связь. Но вот сама связь может быть положительной и отрицательной, и вот именно это показывает знак коэффициента. Ясно. Спасибо. Я понимаю, что означает коэффициент короеляции и знак при нем. Я слышала как то, на конгрессе, докладчик сказал следующее: мы для оценки силы связи, пересчитали коэф корреляции, для этого мы связались со статистиками, и убедились в еще более тесной связи двух показателей, при этом про сам стат анализ он не уточнял А моей коллеге порекомендовал статистик коэффициент корряции Пирсона ( в ее работе три коэффициента указаны, не помню какой том еще, Кэндал что ли.)., он ей преобразовал данные, логарифмируя их, и зачем то это вошло в ее работу. Ни о какой регрессии просто речь там не шла, поэтому я и спрашиваю,, это просто мои догадки были Сообщение отредактировал salm - 9.07.2022 - 18:15 |
|
10.07.2022 - 17:00
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 204 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 |
Мы предполагали что связь сильнее будет у того из параметров, что показал слабее связь. Ну вот, начинается: найдите мне единственно правильный метод, который докажет, что наше предположение верно, а то перепробованные не хотят. Что нужно сделать в первую очередь: посмотреть на диаграммы рассеяния. Сообщение отредактировал ИНО - 10.07.2022 - 17:01 |
|