Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Объяснение корреляций
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
psychologist
Что такое линейные корреляции положительные или отрицательные думаю все тут понимают. Давайте возьмем пример: Переменная х положительно коррелирует с переменной у! т.е. чем больше х, тем больше у. Это понятно, но как проанализировать природу этих взаимосвязей. Иными словами какая переменная оказывает большее влияние на другую?
p2004r
Цитата(psychologist @ 10.02.2014 - 21:27) *
Что такое линейные корреляции положительные или отрицательные думаю все тут понимают. Давайте возьмем пример: Переменная х положительно коррелирует с переменной у! т.е. чем больше х, тем больше у. Это понятно, но как проанализировать природу этих взаимосвязей. Иными словами какая переменная оказывает большее влияние на другую?


а сами то как думаете? (С)

если есть какие то предположения о природе связи, то надо рисовать уравнение регрессии в которое будут входит разным способом посторонняя дисперсия и дисперсия независимой переменной

без предположений о природе посторонней дисперсии и том какая переменная является независимой никак. конечно можно посчитать все варианты и выбрать "самый вероятный" исходя из каких то соображений. ну например независимость случайных компонентов, вид их распределений и т.п.

кроме того: 1) эти переменные надо смотреть глазами обязательно на коррелограмме, поскольку корреляция может быть ложной 2) использовать ещё дополнительные переменные строя например баейеснетворк для которого есть масса тестов определяющих вероятность направления взаимосвязи.
nokh
Цитата(psychologist @ 11.02.2014 - 00:27) *
Что такое линейные корреляции положительные или отрицательные думаю все тут понимают. Давайте возьмем пример: Переменная х положительно коррелирует с переменной у! т.е. чем больше х, тем больше у. Это понятно, но как проанализировать природу этих взаимосвязей

В общем случае и статистически - никак. Считаю, что грамотному исследователю вообще нужно выводить из своего лексикона расхожий термин "взаимосвязь": в подавляющем большинстве случаев он не уместен, т.к. уже предполагает механизм обратной связи.
"Связь" - более ёмкий термин, чем "зависимость". Помимо прямого влияния может быть опостредованное влияние, может быть взаимное влияние, может быть влияние третьей переменной на две коррелирующие и т.д. Поэтому здесь нужно привлекать другие (нестатистические) методы исследования + знания в предметной области.
Цитата(psychologist @ 11.02.2014 - 00:27) *
Иными словами какая переменная оказывает большее влияние на другую?

Длина руки положительно коррелирует с длиной ноги. Можно ли сказать, что длина ноги "оказывает большее влияние" на длину руки или наоборот?
100$
Тут кроме общефилософских замечаний можно озвучить еще и технические: многое зависит от того, берется ли корреляция по множеству или по последовательности. Если коррелируют два ряда динамики, то с технической точки зрения лучше коррелировать детрендированные ряды: либо первые разности, либо остатки от линейной регрессии.
Чтобы не наделать выводов, которые очень нравятся исследователю. Но это так, к слову.
p2004r
Ну вот представим, что у меня есть модель упругого резервуара, и я наблюдаю два параметра АД и пульс с лучевой. Если тупо посчитать кк, то естественно ничего существенного я не смогу получить. Но если я построю модель со скрытыми параметрами, то лёгким движением руки я внезапно получаю смещенную оценку кровотока (при чем там по моему и просто пульса с лучевой хватит smile.gif. А проводя периодически калибровку, то и несмещенную оценку тоже.

То есть можно строить "графические модели со скрытыми параметрами" (или параметры фильтра Калмана оптимизировать) и иметь профит даже в случае двух(а то и одной) переменной.

Остается вопрос можно ли идентификацию системы называть статистикой?
psychologist
Коллеги, спасибо Вам большое
[/b][quote
здесь нужно привлекать другие (нестатистические) методы исследования
[/quote]
Подскажите, а какие именно
100$, что вы подразумеваете под динамикой?
100$
Цитата(psychologist @ 11.02.2014 - 17:30) *
100$, что вы подразумеваете под динамикой?


Временные ряды. Для них особые статистические процедуры, связанные с тем, что в них элементарный исход понимается еще и как функция времени: хронологию нельзя изменять. Поэтому для их статистического анализа необходимо как минимум убедиться в эргодичности ("хорошей перемешанности") временного ряда
p2004r
Цитата(psychologist @ 11.02.2014 - 16:30) *
Коллеги, спасибо Вам большое

здесь нужно привлекать другие (нестатистические) методы исследования

Подскажите, а какие именно


Ну вот такие например http://cran.r-project.org/web/packages/FKF/index.html (там внутри pdf c описанием идентификации двух примеров систем)

Если Вы описали передаточную функцию (для этого надо сделать преобразование Лапласа системы диффуров своей системы и записать его в матричной форме) своей системы, то легко и непринужденно получите её параметры. Причем можно и меняющиеся по времени!



psychologist
Цитата(p2004r @ 10.02.2014 - 22:07) *
если есть какие то предположения о природе связи, то надо рисовать уравнение регрессии в которое будут входит разным способом посторонняя дисперсия и дисперсия независимой переменной

В той же статистике стал проводить simple regression получил такие р-ты

Как мне тут найти природу корреляции.
Например, когда я использую Множ.рег. анализ(MRA) . тут все ясно я просто согласно уравнению складывая переменные и смотрю насколько они близки к зависимой.
но вот я получил такие ре-ты
1. скорректированный квадрат =0,20
2. коэф детерминации =0,46
Что я могу сказать о взаимосвязи этих 2х переменных.
psychologist
забыл добавить параметры оценки
100$
Цитата(psychologist @ 22.02.2014 - 13:14) *
Что я могу сказать о взаимосвязи этих 2х переменных.


Что они отрицательно закоррелированы
psychologist
100$, это я мог бы узнать и без проведения симпл регресии.))
100$
Цитата(psychologist @ 22.02.2014 - 15:31) *
100$, это я мог бы узнать и без проведения симпл регресии.))


Дружище, я уже начал отмечать День защитника Отечества, так что вам не удастся вывести меня из себя smile.gif

Ну, а если серьезно, ваши вопросы без вопросительных знаков оставляют у собеседников тягостное ощущение того, что вы ничего не поняли из предыдущих постов, хотя и поблагодарили.
Регрессия ничего не говорит о природе корреляции. Это-всего лишь способ отмоделировать (найденную?) зависимость.
Судите сами: линейная регрессия в природе одна-единственная, а различных корреляций (в т.ч. связей типа корреляции) великое множество.
Н-р, линейная корреляция между с.в. может отсутствовать, а параболическая-наличествовать.

И задайте, наконец, какой-нибудь осмысленный вопрос. Вам статпакет выдал протокол оценивания простейшей из моделей-парной линейной регресии. Что непонятно-то?
Вам будет любезно отвечено.
psychologist
Приятного праздника:)
Я просто тогда не понимаю смысла в простой регрессии. Её назначения. Чем она удобнее множественной.
100$
Цитата(psychologist @ 23.02.2014 - 21:46) *
Приятного праздника:)
Я просто тогда не понимаю смысла в простой регрессии. Её назначения. Чем она удобнее множественной.


Эйнштейн дал установку: "Модель должна быть настолько простой, насколько это возможно, но не проще".
Бокс конкретизировал: "Все модели неправильны, но некоторые бывают полезны".

Такова квинтэссенция регрессионного анализа.

А вообще, я в растерянности: мы же вроде бы корреляцию обсуждали. Так все хорошо начиналось.
psychologist
Вы правы, мы начали с корреляций и добъем их.
у меня есть 2D график корреляции 2-х признаков, мы видим что корреляция отрицательна . Но мне не ясно откуда взялись значения от -2 до 10 по осям. что значит это прямая линия , которая идет от 6 до 10 по нисходящей.
И ведь тут получается, что не малое кол-во людей находится за пределами доверительного интервала.
100$
Цитата(psychologist @ 25.02.2014 - 16:07) *
Вы правы, мы начали с корреляций и добъем их.
у меня есть 2D график корреляции 2-х признаков, мы видим что корреляция отрицательна . Но мне не ясно откуда взялись значения от -2 до 10 по осям. что значит это прямая линия , которая идет от 6 до 10 по нисходящей.
И ведь тут получается, что не малое кол-во людей находится за пределами доверительного интервала.


У вас есть линия регрессии, уравнение которой вынесено в заголовок, есть доверительный интервал к линии регрессии, в котором с 95% вероятностью находится условное математическое ожидание зависимой переменной (отклика).
Исходные данные и не должны попадать в этот интервал.
Как говорил Кашпировский, это нормально.
psychologist
Если я Вас правильно понял, то этот интервал двусторонний. Т.е. с одной стороны мат.ожидание в интервале от 5-8 а с другой от 0-3?
А откуда взялись значени 5,64 - 0,40 и чему равен х?
100$
Цитата(psychologist @ 25.02.2014 - 17:06) *
Если я Вас правильно понял, то этот интервал двусторонний. Т.е. с одной стороны мат.ожидание в интервале от 5-8 а с другой от 0-3?
А откуда взялись значени 5,64 - 0,40 и чему равен х?


X-это значения оси абсцисс;
5,64-значение константы (свободного члена);
-,40- коэффициент угла наклона линии регрессии;
Итоговое уравнение: Yрасчетное=f(x)=5,64-,40*х.
Какое бы значение х вы не сунули в это уравнение, Yрасч с 95%-ной вероятностью попадет в область между двумя пунктирными линиями.
Все просто.
psychologist
Да, реально просто вы объясняете, я начал врубаться. Вопрос из серии критических значений. А есть ли какие-нибудь стандарты в плане угла наклона к оси абсцисс. Например 40 это хорошо, а 30 , это плохо.
И все же конкретно откуда эти числа от -2 до 10 были взяты?
100$
Цитата(psychologist @ 25.02.2014 - 17:41) *
Да, реально просто вы объясняете, я начал врубаться. Вопрос из серии критических значений. А есть ли какие-нибудь стандарты в плане угла наклона к оси абсцисс. Например 40 это хорошо, а 30 , это плохо.
И все же конкретно откуда эти числа от -2 до 10 были взяты?


Реальные значения обеих переменных, названных статпакетом незатейливо measure09 и measure05, изменяются, как я погляжу, от 0 до 9.
Настроить оси на диаграмме можно в соответствии с ними.
Ну, а что вы там измеряли - это вопрос не ко мне.

И последнее. Коэффициент наклона вычисляется как коэффициент корреляции, умноженный на отношение стандартных отклонений зависимой переменной и объясняющей.
Коэффициент корреляции - случайная величина, которая проверяется на статистическую значимость по процентным точкам распределения Стьюдента.
При этом в статистике принято, что нулевую гипотезу статистическим тестом можно отклонить, но нельзя подтвердить. Поэтому решение о том, принять ли нулевую гипотезу или ограничиться вежливым "не отвергается", принимаете
лично вы. И это - не статистический акт. Именно поэтому статистика не отвечает на вопрос Маяковского "Что такое хорошо и что такое плохо". Она отвечает на вопрос о том, случайны или нет наблюдаемые различия.
psychologist
Хорошо сказали про маяквского))
Ладно последний вопрос меня интересовал касательно корреляций по Спирману и Кенделу. Я так понял ранги они считают одинаково, а вот корреляции по разному, не факт, что они дадут один и тот же коэф корр. на одних и тех же переменных. Исходя из этого в каких случаях уместно использовать R-spirman , а в какие тау.
100$
Цитата(psychologist @ 25.02.2014 - 18:54) *
Ладно последний вопрос меня интересовал касательно корреляций по Спирману и Кенделу. Я так понял ранги они считают одинаково, а вот корреляции по разному, не факт, что они дадут один и тот же коэф корр. на одних и тех же переменных. Исходя из этого в каких случаях уместно использовать R-spirman , а в какие тау.


Спирмен, Кендалл - дело вкуса. Просто Кендалл чуть чуть "пессимистичнее" Спирмена: всегда по абсолютному значению меньше. Условия применения - стандартные для непараметрической статистики: непрерывные распределения, хотя по своей природе дают адекватное представление о корреляции и в случае порядковых данных (измеренных в порядковой шкале).

P.S. Дружище, а почему Спирмен и Кендалл - у вас с большой буквы, а Маяковский - с маленькой? Рылом не вышел?
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.