Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Объяснение корреляций
psychologist
сообщение 10.02.2014 - 21:27
Сообщение #1





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



Что такое линейные корреляции положительные или отрицательные думаю все тут понимают. Давайте возьмем пример: Переменная х положительно коррелирует с переменной у! т.е. чем больше х, тем больше у. Это понятно, но как проанализировать природу этих взаимосвязей. Иными словами какая переменная оказывает большее влияние на другую?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
2 страниц V   1 2 >  
Открыть тему
Ответов (1 - 22)
p2004r
сообщение 10.02.2014 - 22:07
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(psychologist @ 10.02.2014 - 21:27) *
Что такое линейные корреляции положительные или отрицательные думаю все тут понимают. Давайте возьмем пример: Переменная х положительно коррелирует с переменной у! т.е. чем больше х, тем больше у. Это понятно, но как проанализировать природу этих взаимосвязей. Иными словами какая переменная оказывает большее влияние на другую?


а сами то как думаете? (С)

если есть какие то предположения о природе связи, то надо рисовать уравнение регрессии в которое будут входит разным способом посторонняя дисперсия и дисперсия независимой переменной

без предположений о природе посторонней дисперсии и том какая переменная является независимой никак. конечно можно посчитать все варианты и выбрать "самый вероятный" исходя из каких то соображений. ну например независимость случайных компонентов, вид их распределений и т.п.

кроме того: 1) эти переменные надо смотреть глазами обязательно на коррелограмме, поскольку корреляция может быть ложной 2) использовать ещё дополнительные переменные строя например баейеснетворк для которого есть масса тестов определяющих вероятность направления взаимосвязи.

Сообщение отредактировал p2004r - 10.02.2014 - 22:28


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 10.02.2014 - 23:25
Сообщение #3





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(psychologist @ 11.02.2014 - 00:27) *
Что такое линейные корреляции положительные или отрицательные думаю все тут понимают. Давайте возьмем пример: Переменная х положительно коррелирует с переменной у! т.е. чем больше х, тем больше у. Это понятно, но как проанализировать природу этих взаимосвязей

В общем случае и статистически - никак. Считаю, что грамотному исследователю вообще нужно выводить из своего лексикона расхожий термин "взаимосвязь": в подавляющем большинстве случаев он не уместен, т.к. уже предполагает механизм обратной связи.
"Связь" - более ёмкий термин, чем "зависимость". Помимо прямого влияния может быть опостредованное влияние, может быть взаимное влияние, может быть влияние третьей переменной на две коррелирующие и т.д. Поэтому здесь нужно привлекать другие (нестатистические) методы исследования + знания в предметной области.
Цитата(psychologist @ 11.02.2014 - 00:27) *
Иными словами какая переменная оказывает большее влияние на другую?

Длина руки положительно коррелирует с длиной ноги. Можно ли сказать, что длина ноги "оказывает большее влияние" на длину руки или наоборот?

Сообщение отредактировал nokh - 10.02.2014 - 23:47
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 11.02.2014 - 09:11
Сообщение #4





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Тут кроме общефилософских замечаний можно озвучить еще и технические: многое зависит от того, берется ли корреляция по множеству или по последовательности. Если коррелируют два ряда динамики, то с технической точки зрения лучше коррелировать детрендированные ряды: либо первые разности, либо остатки от линейной регрессии.
Чтобы не наделать выводов, которые очень нравятся исследователю. Но это так, к слову.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 11.02.2014 - 11:00
Сообщение #5





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Ну вот представим, что у меня есть модель упругого резервуара, и я наблюдаю два параметра АД и пульс с лучевой. Если тупо посчитать кк, то естественно ничего существенного я не смогу получить. Но если я построю модель со скрытыми параметрами, то лёгким движением руки я внезапно получаю смещенную оценку кровотока (при чем там по моему и просто пульса с лучевой хватит smile.gif. А проводя периодически калибровку, то и несмещенную оценку тоже.

То есть можно строить "графические модели со скрытыми параметрами" (или параметры фильтра Калмана оптимизировать) и иметь профит даже в случае двух(а то и одной) переменной.

Остается вопрос можно ли идентификацию системы называть статистикой?


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 11.02.2014 - 16:30
Сообщение #6





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



Коллеги, спасибо Вам большое
[/b][quote
здесь нужно привлекать другие (нестатистические) методы исследования
[/quote]
Подскажите, а какие именно
100$, что вы подразумеваете под динамикой?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 11.02.2014 - 17:36
Сообщение #7





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(psychologist @ 11.02.2014 - 17:30) *
100$, что вы подразумеваете под динамикой?


Временные ряды. Для них особые статистические процедуры, связанные с тем, что в них элементарный исход понимается еще и как функция времени: хронологию нельзя изменять. Поэтому для их статистического анализа необходимо как минимум убедиться в эргодичности ("хорошей перемешанности") временного ряда
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 11.02.2014 - 19:33
Сообщение #8





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(psychologist @ 11.02.2014 - 16:30) *
Коллеги, спасибо Вам большое

здесь нужно привлекать другие (нестатистические) методы исследования

Подскажите, а какие именно


Ну вот такие например http://cran.r-project.org/web/packages/FKF/index.html (там внутри pdf c описанием идентификации двух примеров систем)

Если Вы описали передаточную функцию (для этого надо сделать преобразование Лапласа системы диффуров своей системы и записать его в матричной форме) своей системы, то легко и непринужденно получите её параметры. Причем можно и меняющиеся по времени!





Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 22.02.2014 - 12:14
Сообщение #9





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



Цитата(p2004r @ 10.02.2014 - 22:07) *
если есть какие то предположения о природе связи, то надо рисовать уравнение регрессии в которое будут входит разным способом посторонняя дисперсия и дисперсия независимой переменной

В той же статистике стал проводить simple regression получил такие р-ты

Как мне тут найти природу корреляции.
Например, когда я использую Множ.рег. анализ(MRA) . тут все ясно я просто согласно уравнению складывая переменные и смотрю насколько они близки к зависимой.
но вот я получил такие ре-ты
1. скорректированный квадрат =0,20
2. коэф детерминации =0,46
Что я могу сказать о взаимосвязи этих 2х переменных.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 22.02.2014 - 12:35
Сообщение #10





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



забыл добавить параметры оценки
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 22.02.2014 - 13:07
Сообщение #11





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(psychologist @ 22.02.2014 - 13:14) *
Что я могу сказать о взаимосвязи этих 2х переменных.


Что они отрицательно закоррелированы
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 22.02.2014 - 14:31
Сообщение #12





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



100$, это я мог бы узнать и без проведения симпл регресии.))
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 22.02.2014 - 16:38
Сообщение #13





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(psychologist @ 22.02.2014 - 15:31) *
100$, это я мог бы узнать и без проведения симпл регресии.))


Дружище, я уже начал отмечать День защитника Отечества, так что вам не удастся вывести меня из себя smile.gif

Ну, а если серьезно, ваши вопросы без вопросительных знаков оставляют у собеседников тягостное ощущение того, что вы ничего не поняли из предыдущих постов, хотя и поблагодарили.
Регрессия ничего не говорит о природе корреляции. Это-всего лишь способ отмоделировать (найденную?) зависимость.
Судите сами: линейная регрессия в природе одна-единственная, а различных корреляций (в т.ч. связей типа корреляции) великое множество.
Н-р, линейная корреляция между с.в. может отсутствовать, а параболическая-наличествовать.

И задайте, наконец, какой-нибудь осмысленный вопрос. Вам статпакет выдал протокол оценивания простейшей из моделей-парной линейной регресии. Что непонятно-то?
Вам будет любезно отвечено.

Сообщение отредактировал 100$ - 22.02.2014 - 16:42
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 23.02.2014 - 20:46
Сообщение #14





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



Приятного праздника:)
Я просто тогда не понимаю смысла в простой регрессии. Её назначения. Чем она удобнее множественной.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 24.02.2014 - 08:32
Сообщение #15





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(psychologist @ 23.02.2014 - 21:46) *
Приятного праздника:)
Я просто тогда не понимаю смысла в простой регрессии. Её назначения. Чем она удобнее множественной.


Эйнштейн дал установку: "Модель должна быть настолько простой, насколько это возможно, но не проще".
Бокс конкретизировал: "Все модели неправильны, но некоторые бывают полезны".

Такова квинтэссенция регрессионного анализа.

А вообще, я в растерянности: мы же вроде бы корреляцию обсуждали. Так все хорошо начиналось.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 25.02.2014 - 15:07
Сообщение #16





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



Вы правы, мы начали с корреляций и добъем их.
у меня есть 2D график корреляции 2-х признаков, мы видим что корреляция отрицательна . Но мне не ясно откуда взялись значения от -2 до 10 по осям. что значит это прямая линия , которая идет от 6 до 10 по нисходящей.
И ведь тут получается, что не малое кол-во людей находится за пределами доверительного интервала.
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 25.02.2014 - 15:36
Сообщение #17





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(psychologist @ 25.02.2014 - 16:07) *
Вы правы, мы начали с корреляций и добъем их.
у меня есть 2D график корреляции 2-х признаков, мы видим что корреляция отрицательна . Но мне не ясно откуда взялись значения от -2 до 10 по осям. что значит это прямая линия , которая идет от 6 до 10 по нисходящей.
И ведь тут получается, что не малое кол-во людей находится за пределами доверительного интервала.


У вас есть линия регрессии, уравнение которой вынесено в заголовок, есть доверительный интервал к линии регрессии, в котором с 95% вероятностью находится условное математическое ожидание зависимой переменной (отклика).
Исходные данные и не должны попадать в этот интервал.
Как говорил Кашпировский, это нормально.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 25.02.2014 - 16:06
Сообщение #18





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



Если я Вас правильно понял, то этот интервал двусторонний. Т.е. с одной стороны мат.ожидание в интервале от 5-8 а с другой от 0-3?
А откуда взялись значени 5,64 - 0,40 и чему равен х?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 25.02.2014 - 16:21
Сообщение #19





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(psychologist @ 25.02.2014 - 17:06) *
Если я Вас правильно понял, то этот интервал двусторонний. Т.е. с одной стороны мат.ожидание в интервале от 5-8 а с другой от 0-3?
А откуда взялись значени 5,64 - 0,40 и чему равен х?


X-это значения оси абсцисс;
5,64-значение константы (свободного члена);
-,40- коэффициент угла наклона линии регрессии;
Итоговое уравнение: Yрасчетное=f(x)=5,64-,40*х.
Какое бы значение х вы не сунули в это уравнение, Yрасч с 95%-ной вероятностью попадет в область между двумя пунктирными линиями.
Все просто.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 25.02.2014 - 16:41
Сообщение #20





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



Да, реально просто вы объясняете, я начал врубаться. Вопрос из серии критических значений. А есть ли какие-нибудь стандарты в плане угла наклона к оси абсцисс. Например 40 это хорошо, а 30 , это плохо.
И все же конкретно откуда эти числа от -2 до 10 были взяты?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 25.02.2014 - 17:14
Сообщение #21





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(psychologist @ 25.02.2014 - 17:41) *
Да, реально просто вы объясняете, я начал врубаться. Вопрос из серии критических значений. А есть ли какие-нибудь стандарты в плане угла наклона к оси абсцисс. Например 40 это хорошо, а 30 , это плохо.
И все же конкретно откуда эти числа от -2 до 10 были взяты?


Реальные значения обеих переменных, названных статпакетом незатейливо measure09 и measure05, изменяются, как я погляжу, от 0 до 9.
Настроить оси на диаграмме можно в соответствии с ними.
Ну, а что вы там измеряли - это вопрос не ко мне.

И последнее. Коэффициент наклона вычисляется как коэффициент корреляции, умноженный на отношение стандартных отклонений зависимой переменной и объясняющей.
Коэффициент корреляции - случайная величина, которая проверяется на статистическую значимость по процентным точкам распределения Стьюдента.
При этом в статистике принято, что нулевую гипотезу статистическим тестом можно отклонить, но нельзя подтвердить. Поэтому решение о том, принять ли нулевую гипотезу или ограничиться вежливым "не отвергается", принимаете
лично вы. И это - не статистический акт. Именно поэтому статистика не отвечает на вопрос Маяковского "Что такое хорошо и что такое плохо". Она отвечает на вопрос о том, случайны или нет наблюдаемые различия.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 25.02.2014 - 17:54
Сообщение #22





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



Хорошо сказали про маяквского))
Ладно последний вопрос меня интересовал касательно корреляций по Спирману и Кенделу. Я так понял ранги они считают одинаково, а вот корреляции по разному, не факт, что они дадут один и тот же коэф корр. на одних и тех же переменных. Исходя из этого в каких случаях уместно использовать R-spirman , а в какие тау.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 25.02.2014 - 21:26
Сообщение #23





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(psychologist @ 25.02.2014 - 18:54) *
Ладно последний вопрос меня интересовал касательно корреляций по Спирману и Кенделу. Я так понял ранги они считают одинаково, а вот корреляции по разному, не факт, что они дадут один и тот же коэф корр. на одних и тех же переменных. Исходя из этого в каких случаях уместно использовать R-spirman , а в какие тау.


Спирмен, Кендалл - дело вкуса. Просто Кендалл чуть чуть "пессимистичнее" Спирмена: всегда по абсолютному значению меньше. Условия применения - стандартные для непараметрической статистики: непрерывные распределения, хотя по своей природе дают адекватное представление о корреляции и в случае порядковых данных (измеренных в порядковой шкале).

P.S. Дружище, а почему Спирмен и Кендалл - у вас с большой буквы, а Маяковский - с маленькой? Рылом не вышел?

Сообщение отредактировал 100$ - 25.02.2014 - 21:28
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему