Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Как оценить различия в силе связи между переменными?
Alex_Z
сообщение 14.03.2012 - 21:11
Сообщение #1





Группа: Пользователи
Сообщений: 59
Регистрация: 23.12.2011
Пользователь №: 23383



Есть две группы. В каждой применялся различный метод лечения. Оценивалась динамика по шкале APACHE II до лечения, на первые сутки и на пятые сутки. Нужно проанализировать зависимость суммарной динамики (разность баллов этапа "до" и этапа "5 сутки") от исходной тяжести состояния (баллы APACHE II "до")
Гипотезы, которые я хочу проверить (и предполагаемый способ проверки)
1. Суммарная динамика в подгруппах зависит от исходной тяжести состояния.
Оценить силу связи коэффициентом корреляции Спирмена.

2. Суммарная динамика в подгруппах достоверно различается в зависимости от исходной тяжести состояния. - Т.е., возможно, в первой подгруппе достигается более выраженная динамика, но до определенной тяжести состояния (исходного количества баллов). Как хочу проверить: ранжировать динамику (или исходное количество баллов??) и посмотреть различия в суммарной динамике между группами в каждом ранге.

3. Зависимость (сила связи) суммарной динамики от исходной тяжести состояния различается в подгруппах. Как можно оценить?

4. Сила связи суммарной динамики и исходной тяжести меняется с увеличением исходного количества баллов (возможно, в какой-то подгруппе возрастает, в какой-то ? уменьшается, или изменяется одинаково в обеих подгруппах). Сначала оценить графически (как на рисунке). Как выразить это цифрами?

Что посоветуете? Какими методами можно решить данные задачи?

P.S. На рисунке - линия тренда - линия линейной регрессии (1). Если выбрать квадратичную (2) регрессию или кубическую (3), то линия группы сравнения веден себя по-разному. Какую выбрать?

Сообщение отредактировал Alex_Z - 14.03.2012 - 21:13
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
YVR
сообщение 20.03.2012 - 16:38
Сообщение #2





Группа: Пользователи
Сообщений: 63
Регистрация: 20.03.2012
Из: Ташкент
Пользователь №: 23582



Цитата(Alex_Z @ 14.03.2012 - 23:11) *
P.S. На рисунке - линия тренда - линия линейной регрессии (1). Если выбрать квадратичную (2) регрессию или кубическую (3), то линия группы сравнения веден себя по-разному. Какую выбрать?

Наиболее адекватную. Адекватность для регрессионных моделей - максимальная близость абсолютного значения коэффициента корреляции к 1


Signature
Yury V. Reshetov

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 20.03.2012 - 16:56
Сообщение #3





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(YVR @ 20.03.2012 - 16:38) *
Наиболее адекватную. Адекватность для регрессионных моделей - максимальная близость абсолютного значения коэффициента корреляции к 1


Только не корреляции, а детерминации, причем скорректированный
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
YVR
сообщение 20.03.2012 - 18:52
Сообщение #4





Группа: Пользователи
Сообщений: 63
Регистрация: 20.03.2012
Из: Ташкент
Пользователь №: 23582



Цитата(100$ @ 20.03.2012 - 18:56) *
Только не корреляции, а детерминации, причем скорректированный


Вы о чем?

Детерминация в данном случае неадекватна, т.к. речь в обоих выборках идет о динамике, т.е. функции от одной переменной - времени, модель которой топикстатер пытается построить для каждой выборки. Детерминация вычисляется в случаях двух или более объясняющих переменных.

Практически, явных зависимостей вообще не видно, дисперсия остатков зашкаливает. Да и судя по данным на скринах, максимальный R^2 = 0.125, а следовательно коэффициент корреляции 0.353. Т.е. это заведомый глухарь, а не тема для исследований.

Сообщение отредактировал YVR - 20.03.2012 - 18:54


Signature
Yury V. Reshetov

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 21.03.2012 - 00:11
Сообщение #5





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата
Вы о чем?


Мы - о скорректированном коэффициенте детерминации, а вы- о квадратном корне из R^2.

Цитата
Детерминация в данном случае неадекватна... Детерминация вычисляется в случаях двух или более объясняющих переменных.


Это ваш личный вклад в науку? А в чем принципиальное отличие множественной линейной регресии от парной?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
YVR
сообщение 21.03.2012 - 06:32
Сообщение #6





Группа: Пользователи
Сообщений: 63
Регистрация: 20.03.2012
Из: Ташкент
Пользователь №: 23582



Цитата(100$ @ 21.03.2012 - 02:11) *
Мы - о скорректированном коэффициенте детерминации, а вы- о квадратном корне из R^2.


Квадратный корень из R^2 (коэф. детерминации) в случае парной регрессии - коэффициент корреляции по абсолютному значению. Но коэффициент детерминации менее информативен по сравнению с коэффициентом корреляции, т.к. коэффициент корреляции всегда имеет знак, а коэффициент детерминации его не имеет. Скорректированный может иметь и отрицательное значение, но в случае его отрицательности результаты вообще не стоит принимать во внимание.

А адекватным применение скорректированного коэффициента детерминации является только лишь в случаях когда сравниваются две или более регрессионные модели, но при этом количество объясняющих переменных в моделях различно. Потому что основное предназначение скорректированного коэффициента детерминации - умалить влияние разности количества переменных, объясняющих зависимую переменную.

В случаях, когда сравниваемые регрессионные модели имеют одинаковое количество объясняющих переменных, корректировать коэффициент детерминации нет никакой необходимости - это уже эпигонство. В таком случае нескорректированный коэффициент детерминации является более информативным, в особенности когда сравниваемые модели имеют одинаковое количество объясняющих переменных, но эти самые объясняющие переменные различны. Ведь с помощью нескорректированного коэффициента детерминации мы можем адекватно оценить степень влияния объясняющих переменных.

Т.е. например берем две модели, в одной присутствует независимая переменная А, а во второй переменная А заменяется на переменную B. Вычисляем для этих самых моделей коэффициент детерминации. Если коэффициент значительно выше для модели с переменной А, значит замена А на B не является адекватной. В случае, когда модель с переменной B заметно улучшит коэффициент, замена переменных А на B является адекватной.


Цитата(100$ @ 21.03.2012 - 02:11) *
Это ваш личный вклад в науку?


Это не мой личный вклад в науку, а элементарные базовые принципы, согласно которым те или иные математические методы необходимо применять лишь в тех случаях, когда для этого имеются явные показания. Что такое коэффициент детерминации и в каких случаях его необходимо корректировать, подробно описано в соответствующей справочной литературе без меня, т.е. без моего вклада. Я всего лишь поясняю прописные истины, дабы другие не пытались наступить на грабли, которые Вы советуете подставить под ноги, не разобравшись в вопросе.

Цитата(100$ @ 21.03.2012 - 02:11) *
А в чем принципиальное отличие множественной линейной регресии от парной?


С трех раз самостоятельно не можете догадаться? Тогда подскажу: множественная от парной отличается множеством объясняющих переменных, а парная - единственной.

Сообщение отредактировал YVR - 21.03.2012 - 08:57


Signature
Yury V. Reshetov

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 21.03.2012 - 14:21
Сообщение #7





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(YVR @ 21.03.2012 - 06:32) *
Квадратный корень из R^2 (коэф. детерминации) в случае парной регрессии - коэффициент корреляции по абсолютному значению. Но коэффициент детерминации менее информативен по сравнению с коэффициентом корреляции, т.к. коэффициент корреляции всегда имеет знак, а коэффициент детерминации его не имеет. Скорректированный может иметь и отрицательное значение, но в случае его отрицательности результаты вообще не стоит принимать во внимание.


Т.е. например берем две модели, в одной присутствует независимая переменная А, а во второй переменная А заменяется на переменную B. Вычисляем для этих самых моделей коэффициент детерминации. Если коэффициент значительно выше для модели с переменной А, значит замена А на B не является адекватной. В случае, когда модель с переменной B заметно улучшит коэффициент, замена переменных А на B является адекватной.


Это не мой личный вклад в науку, а элементарные базовые принципы, согласно которым те или иные математические методы необходимо применять лишь в тех случаях, когда для этого имеются явные показания. Что такое коэффициент детерминации и в каких случаях его необходимо корректировать, подробно описано в соответствующей справочной литературе без меня, т.е. без моего вклада. Я всего лишь поясняю прописные истины, дабы другие не пытались наступить на грабли, которые Вы советуете подставить под ноги, не разобравшись в вопросе.



Цитата
Квадратный корень из R^2 (коэф. детерминации) в случае парной регрессии - коэффициент корреляции по абсолютному значению. Но коэффициент детерминации менее информативен по сравнению с коэффициентом корреляции, т.к. коэффициент корреляции всегда имеет знак, а коэффициент детерминации его не имеет. Скорректированный может иметь и отрицательное значение, но в случае его отрицательности результаты вообще не стоит принимать во внимание.



Чаще всего корреляционный анализ предшествует регрессионному: сначала устанавливается факт наличия связи между двумя явлениями: определили силу связи (абс. значение и стат. значимость к-та корр.), потом - направление (знак). Затем приступают к моделированию зависимостей.
Кроме того, в регрессионном анализе коэф-т корреляции - линейный (Пирсон), применение которого по отношению к балльным шкалам - моветон.
А знак коэф-та корреляции в регресиионном анализе н-р, в случае парной линейной регресии определяется знаком коэффициента угла наклона.

И вообще в регрессионном анализе вся информация - перед глазами: к-т детерминации R^2, скорректированный R^2 adjusted, значение логарифмической функции правдоподобия, SSR, SER , F- ratio, статистика Дарбина-Уотсона, etc. Вот только сравнивать ее по степени информативности можно только после затянувшегося застолья.

Цитата
В случаях, когда сравниваемые регрессионные модели имеют одинаковое количество объясняющих переменных, корректировать коэффициент детерминации нет никакой необходимости - это уже эпигонство. В таком случае нескорректированный коэффициент детерминации является более информативным, в особенности когда сравниваемые модели имеют одинаковое количество объясняющих переменных, но эти самые объясняющие переменные различны. Ведь с помощью нескорректированного коэффициента детерминации мы можем адекватно оценить степень влияния объясняющих переменных.


Давайте внесем ясность: человек в посте ?1 вывесил три регрессионные модели, отличающиеся разным количеством переменных: парную линейную, параболическую и кубическую и задал вопрос: как выбрать наилучшую? Ему было любезно отвечено. В этой связи предлагаю сократить вашу (интересную) лекцыю до единственного абзаца:

Цитата
А адекватным применение скорректированного коэффициента детерминации является только лишь в случаях когда сравниваются две или более регрессионные модели, но при этом количество объясняющих переменных в моделях различно. Потому что основное предназначение скорректированного коэффициента детерминации - умалить влияние разности количества переменных, объясняющих зависимую переменную.


тем более, что после введения в обиход информационных критериев Акайке, Шварца и Хеннана-Куинна применение скорректированного критерия (R^2 adj) как-то отошло на второй план.

Цитата
Т.е. например берем две модели, в одной присутствует независимая переменная А, а во второй переменная А заменяется на переменную B. Вычисляем для этих самых моделей коэффициент детерминации. Если коэффициент значительно выше для модели с переменной А, значит замена А на B не является адекватной. В случае, когда модель с переменной B заметно улучшит коэффициент, замена переменных А на B является адекватной.


Модель в обоих случаях - одна и та же (парная линейная регрессия). А то, что разные предикторы- так это называется спецификацией модели. То, что две по-разному специфицированные модели обладают разной объясняющей способностью - так я этого и не оспаривал.


Цитата
С трех раз самостоятельно не можете догадаться? Тогда подскажу: множественная от парной отличается множеством объясняющих переменных, а парная - единственной.


То есть по-вашему это принципиально?

И последнее. Регрессия - это моделирование условного (по распределению регрессоров) математического ожидания зависимой величины (отклика). У топикстартера и зависимая величина (динамика) и регрессор (тяжесть исходного состояния) - величины, измеренные в порядковой шкале. Оперировать по отношению к ним категорией математического ожидания - не корректно. Следовательно, основная предпосылка регрессионного анализа на выполнена. Это-задача не для линейного регресионного анализа. На это человеку также было указано в посте ?3. В этой связи наш треп в отсутствие топикстартера не стоит выеденного яйца. Предлагаю на этом уняться.

Сообщение отредактировал 100$ - 21.03.2012 - 15:32
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Alex_Z   Как оценить различия в силе связи между переменными?   14.03.2012 - 21:11
- - p2004r   Мне представляется что так независимо изображать т...   14.03.2012 - 21:55
- - Larina Tatjana   Цитата(Alex_Z @ 15.03.2012 - 03:41) ...   15.03.2012 - 07:20
- - Alex_Z   Cпасибо за советы! В плане влияния на динамик...   15.03.2012 - 08:24
|- - Larina Tatjana   Цитата(Alex_Z @ 15.03.2012 - 14:54) ...   15.03.2012 - 10:26
|- - p2004r   Цитата(Alex_Z @ 15.03.2012 - 08:24) ...   15.03.2012 - 13:09
- - Alex_Z   Я ничего не пишу об уровнях других предикторов, по...   15.03.2012 - 11:21
- - YVR   Цитата(Alex_Z @ 14.03.2012 - 23:11) ...   20.03.2012 - 16:38
|- - 100$   Цитата(YVR @ 20.03.2012 - 16:38) Наи...   20.03.2012 - 16:56
|- - YVR   Цитата(100$ @ 20.03.2012 - 18:5...   20.03.2012 - 18:52
|- - 100$   ЦитатаВы о чем? Мы - о скорректированном коэффици...   21.03.2012 - 00:11
|- - YVR   Цитата(100$ @ 21.03.2012 - 02:1...   21.03.2012 - 06:32
|- - 100$   Цитата(YVR @ 21.03.2012 - 06:32) Ква...   21.03.2012 - 14:21
- - DrgLena   Нет формулировки цели исследования. Что значит ест...   21.03.2012 - 14:50
|- - 100$   Цитатаможно проанализировать для выживших использ...   21.03.2012 - 16:22
|- - stok1946   Цитата(100$ @ 21.03.2012 - 17:2...   23.05.2012 - 21:08
|- - p2004r   Цитата(stok1946 @ 23.05.2012 - 21:08...   24.05.2012 - 14:39
|- - stok1946   Цитата(p2004r @ 24.05.2012 - 15:39) ...   24.05.2012 - 15:55
|- - p2004r   Цитата(stok1946 @ 24.05.2012 - 15:55...   24.05.2012 - 23:59
|- - RomanPetrov   Цитата(stok1946 @ 24.05.2012 - 16:55...   31.05.2012 - 20:46
- - DrgLena   Конкретно эти оценки я не называю баллами, это ско...   21.03.2012 - 17:01
|- - 100$   Цитата(DrgLena @ 21.03.2012 - 17:01)...   21.03.2012 - 17:18
- - DrgLena   Цитата(100$ @ 21.03.2012 - 17:2...   21.03.2012 - 17:33
|- - 100$   ЦитатаЭто вы зря так про ДА, ищите больше отличий ...   21.03.2012 - 17:52
- - YVR   Цитата(100$ @ 21.03.2012 - 16:2...   21.03.2012 - 20:13
|- - 100$   ЦитатаПоступлю гораздо проще. Поскольку с эпигонам...   21.03.2012 - 20:25
|- - TheThing   Цитата(YVR @ 21.03.2012 - 21:13) В т...   22.03.2012 - 11:17
- - ИкРИНКА   Помогите!Шарики за ролики уже зашли с этим дис...   30.04.2012 - 15:28
|- - nokh   Цитата(ИкРИНКА @ 30.04.2012 - 17:28)...   30.04.2012 - 20:20
|- - ИкРИНКА   [quote name='nokh' date='30.04.2012 - ...   30.04.2012 - 20:33
|- - nokh   Цитата(ИкРИНКА @ 30.04.2012 - 22:33)...   30.04.2012 - 21:53
- - DrgLena   Ссылка работает, за что автору СПАСИБО! Скобоч...   31.05.2012 - 21:33
- - RomanPetrov   ДА!   1.06.2012 - 00:20
- - Alex_Z   Удалите сообщение, пожалуйста.   4.06.2012 - 20:19


Добавить ответ в эту темуОткрыть тему