Как оценить различия в силе связи между переменными? |
Здравствуйте, гость ( Вход | Регистрация )
Как оценить различия в силе связи между переменными? |
14.03.2012 - 21:11
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 59 Регистрация: 23.12.2011 Пользователь №: 23383 |
Есть две группы. В каждой применялся различный метод лечения. Оценивалась динамика по шкале APACHE II до лечения, на первые сутки и на пятые сутки. Нужно проанализировать зависимость суммарной динамики (разность баллов этапа "до" и этапа "5 сутки") от исходной тяжести состояния (баллы APACHE II "до")
Гипотезы, которые я хочу проверить (и предполагаемый способ проверки) 1. Суммарная динамика в подгруппах зависит от исходной тяжести состояния. Оценить силу связи коэффициентом корреляции Спирмена. 2. Суммарная динамика в подгруппах достоверно различается в зависимости от исходной тяжести состояния. - Т.е., возможно, в первой подгруппе достигается более выраженная динамика, но до определенной тяжести состояния (исходного количества баллов). Как хочу проверить: ранжировать динамику (или исходное количество баллов??) и посмотреть различия в суммарной динамике между группами в каждом ранге. 3. Зависимость (сила связи) суммарной динамики от исходной тяжести состояния различается в подгруппах. Как можно оценить? 4. Сила связи суммарной динамики и исходной тяжести меняется с увеличением исходного количества баллов (возможно, в какой-то подгруппе возрастает, в какой-то ? уменьшается, или изменяется одинаково в обеих подгруппах). Сначала оценить графически (как на рисунке). Как выразить это цифрами? Что посоветуете? Какими методами можно решить данные задачи? P.S. На рисунке - линия тренда - линия линейной регрессии (1). Если выбрать квадратичную (2) регрессию или кубическую (3), то линия группы сравнения веден себя по-разному. Какую выбрать? Сообщение отредактировал Alex_Z - 14.03.2012 - 21:13 |
|
14.03.2012 - 21:55
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Мне представляется что так независимо изображать точки пациентов неправильно. Исследование ведется лонгитудинально. Наилучшим образом для начала данные отобразит http://trellischarts.com/documentation/parallel-plot |
|
15.03.2012 - 07:20
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 49 Регистрация: 3.03.2012 Из: USA Пользователь №: 23536 |
Есть две группы. В каждой применялся различный метод лечения. Оценивалась динамика по шкале APACHE II до лечения, на первые сутки и на пятые сутки. Нужно проанализировать зависимость суммарной динамики (разность баллов этапа "до" и этапа "5 сутки") от исходной тяжести состояния (баллы APACHE II "до") Гипотезы, которые я хочу проверить (и предполагаемый способ проверки) 1. Суммарная динамика в подгруппах зависит от исходной тяжести состояния. Оценить силу связи коэффициентом корреляции Спирмена. 2. Суммарная динамика в подгруппах достоверно различается в зависимости от исходной тяжести состояния. - Т.е., возможно, в первой подгруппе достигается более выраженная динамика, но до определенной тяжести состояния (исходного количества баллов). Как хочу проверить: ранжировать динамику (или исходное количество баллов??) и посмотреть различия в суммарной динамике между группами в каждом ранге. 3. Зависимость (сила связи) суммарной динамики от исходной тяжести состояния различается в подгруппах. Как можно оценить? 4. Сила связи суммарной динамики и исходной тяжести меняется с увеличением исходного количества баллов (возможно, в какой-то подгруппе возрастает, в какой-то ? уменьшается, или изменяется одинаково в обеих подгруппах). Сначала оценить графически (как на рисунке). Как выразить это цифрами? Что посоветуете? Какими методами можно решить данные задачи? P.S. На рисунке - линия тренда - линия линейной регрессии (1). Если выбрать квадратичную (2) регрессию или кубическую (3), то линия группы сравнения веден себя по-разному. Какую выбрать? Привет, Alex_Z'! Приведённая Вами информация явно недостаточна для ответа на поставленные вопросы. Во-первых, если Вы используете балльную шкалу, то сразу встаёт вопрос о корректности использования классических процедур регрессии. Поскольку не будут выполняться классические ограничения. Да и на графике есть лишь значения R-квадрат без указания величины достигнутого уровня значимости. А он будет существенно меняться, т.к. при переходе от одной модели к другой будут меняться и значения степеней свободы. Во-вторых, если бы вместо баллов Вы использовали непрерывный линейный параметр ВЕТА, полученный как линейная сумма взвешенных предикторов, то в этом случае было бы возможно оценить по стандартных критериям качество подгонки. Одним из таких методов была бы проверка гипотез о равенстве дисперсий ошибок всех сравниваемых моделей. Кстати, оборот "достоверно различается" уже говорит о качестве анализа. Применительно к Вашей задаче самое разумное не идти шаблонным путём, т.е. использовать явно устаревшую методу Пола Марино, а применить более современные методы, например, ту же логистическую регрессию. И тогда можно будет сравнить качество разных моделей как по наборам предикторов. так и по величине конкордации. Желаю успеха! |
|
15.03.2012 - 08:24
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 59 Регистрация: 23.12.2011 Пользователь №: 23383 |
Cпасибо за советы!
В плане влияния на динамику я использую три предиктора: флору, локализацию очага и исходную тяжесть соятояния. Как мне кажется, для постороения более-менее нормальной модели, предикторов маловато. Я рассматривал каждый из них отдельно. Так что набор предикторов в именно этой модели, скорее всего, меняться не будет. Интересует только зависимость динамики от исходной тяжести состояния. Я предполагал, что смогу работать с баллами APACHE, как с численными, поскольку они имеют достаточно большой диапазон (1-65). Такое часто встречается в медицинских статьях. Ро Спирмена в 1гр - 0,158; р-0,1. в 2гр - 0,212; р-0,026 Сообщение отредактировал Alex_Z - 15.03.2012 - 08:37 |
|
15.03.2012 - 10:26
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 49 Регистрация: 3.03.2012 Из: USA Пользователь №: 23536 |
Cпасибо за советы! В плане влияния на динамику я использую три предиктора: флору, локализацию очага и исходную тяжесть соятояния. Как мне кажется, для постороения более-менее нормальной модели, предикторов маловато. Я рассматривал каждый из них отдельно. Так что набор предикторов в именно этой модели, скорее всего, меняться не будет. Интересует только зависимость динамики от исходной тяжести состояния. Я предполагал, что смогу работать с баллами APACHE, как с численными, поскольку они имеют достаточно большой диапазон (1-65). Такое часто встречается в медицинских статьях. Ро Спирмена в 1гр - 0,158; р-0,1. в 2гр - 0,212; р-0,026 Увы, и этой информации маловато. Например, Вы пишите что используете "три предиктора: флору, локализацию очага и исходную тяжесть состояния ". Однако при этом ничего не говорите о том, какие конкретно градации, и сколько таких градаций, используется в анализе. Нет ни слова и про объём наблюдений. Ну а аргумент, что в медицинских статьях часто используется APACHE как числовая переменная, есть лишь констатация слабости знаний медиков в биостатистике. Что вполне естественно, ведь они не профессионалы в этой отрасли знания. И к слову, тот факт, что APACHE имеет диапазон 1-65 ни о чём не говорит. Основное отличие балльной шкалы от непрерывной, числовой заключается в другом. Кстати, сравните сами: 65 значений у балльной шкалы, и БЕСКОНЕЧНОЕ КОЛИЧЕСТВО значений у числовой оси. Вернусь к предикторам. Неплохой шанс повысить надёжность модели, это провести со всеми тремя предикторами процедуру бинаризации. Т.е. ввести для каждой градации свой признак с двумя градациями: 1- есть, 0 - нет. Это позволит использовать и другие многомерные модели. Успеха! |
|
15.03.2012 - 11:21
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 59 Регистрация: 23.12.2011 Пользователь №: 23383 |
Я ничего не пишу об уровнях других предикторов, поскольку не хочу строить регрессионную модель с этими предикторами.
|
|
15.03.2012 - 13:09
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Cпасибо за советы! В плане влияния на динамику я использую три предиктора: флору, локализацию очага и исходную тяжесть соятояния. Как мне кажется, для постороения более-менее нормальной модели, предикторов маловато. Я рассматривал каждый из них отдельно. Так что набор предикторов в именно этой модели, скорее всего, меняться не будет. Интересует только зависимость динамики от исходной тяжести состояния. Я предполагал, что смогу работать с баллами APACHE, как с численными, поскольку они имеют достаточно большой диапазон (1-65). Такое часто встречается в медицинских статьях. Ро Спирмена в 1гр - 0,158; р-0,1. в 2гр - 0,212; р-0,026 1. ну вот взяли Вы исходный уровень и разницу исходного уровня с конечным, получилась модель: (конечный - исходный) ~ исходный но можно просто взять модель конечный ~ исходный + (исходный|случай) или более сложную конечный ~ исходный + (1|случай) + (0+исходный|случай) ведь эффект исходного уровня может передаваться конечному уровню и в виде интерцепта и в виде угла наклона. У Вас интерцепт исключен полностью. (естественно приведенные мной модели расширяются еще фактором группа) 2. в книжке Эфрона есть пример как красиво доказывается вид зависимости с помощью бутстрепа http://free-books.us.to/search?req=%D1%8D%...orig&column[]=title&column[]=author&column[]=series&column[]=periodical&column[]=publisher&column[]=year исход операции на сердце от входных параметров там анализируется. |
|
20.03.2012 - 16:38
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 63 Регистрация: 20.03.2012 Из: Ташкент Пользователь №: 23582 |
P.S. На рисунке - линия тренда - линия линейной регрессии (1). Если выбрать квадратичную (2) регрессию или кубическую (3), то линия группы сравнения веден себя по-разному. Какую выбрать? Наиболее адекватную. Адекватность для регрессионных моделей - максимальная близость абсолютного значения коэффициента корреляции к 1 Yury V. Reshetov |
|
20.03.2012 - 16:56
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
|
|
20.03.2012 - 18:52
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 63 Регистрация: 20.03.2012 Из: Ташкент Пользователь №: 23582 |
Только не корреляции, а детерминации, причем скорректированный Вы о чем? Детерминация в данном случае неадекватна, т.к. речь в обоих выборках идет о динамике, т.е. функции от одной переменной - времени, модель которой топикстатер пытается построить для каждой выборки. Детерминация вычисляется в случаях двух или более объясняющих переменных. Практически, явных зависимостей вообще не видно, дисперсия остатков зашкаливает. Да и судя по данным на скринах, максимальный R^2 = 0.125, а следовательно коэффициент корреляции 0.353. Т.е. это заведомый глухарь, а не тема для исследований. Сообщение отредактировал YVR - 20.03.2012 - 18:54 Yury V. Reshetov |
|
21.03.2012 - 00:11
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Цитата Вы о чем? Мы - о скорректированном коэффициенте детерминации, а вы- о квадратном корне из R^2. Цитата Детерминация в данном случае неадекватна... Детерминация вычисляется в случаях двух или более объясняющих переменных. Это ваш личный вклад в науку? А в чем принципиальное отличие множественной линейной регресии от парной? |
|
21.03.2012 - 06:32
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 63 Регистрация: 20.03.2012 Из: Ташкент Пользователь №: 23582 |
Мы - о скорректированном коэффициенте детерминации, а вы- о квадратном корне из R^2. Квадратный корень из R^2 (коэф. детерминации) в случае парной регрессии - коэффициент корреляции по абсолютному значению. Но коэффициент детерминации менее информативен по сравнению с коэффициентом корреляции, т.к. коэффициент корреляции всегда имеет знак, а коэффициент детерминации его не имеет. Скорректированный может иметь и отрицательное значение, но в случае его отрицательности результаты вообще не стоит принимать во внимание. А адекватным применение скорректированного коэффициента детерминации является только лишь в случаях когда сравниваются две или более регрессионные модели, но при этом количество объясняющих переменных в моделях различно. Потому что основное предназначение скорректированного коэффициента детерминации - умалить влияние разности количества переменных, объясняющих зависимую переменную. В случаях, когда сравниваемые регрессионные модели имеют одинаковое количество объясняющих переменных, корректировать коэффициент детерминации нет никакой необходимости - это уже эпигонство. В таком случае нескорректированный коэффициент детерминации является более информативным, в особенности когда сравниваемые модели имеют одинаковое количество объясняющих переменных, но эти самые объясняющие переменные различны. Ведь с помощью нескорректированного коэффициента детерминации мы можем адекватно оценить степень влияния объясняющих переменных. Т.е. например берем две модели, в одной присутствует независимая переменная А, а во второй переменная А заменяется на переменную B. Вычисляем для этих самых моделей коэффициент детерминации. Если коэффициент значительно выше для модели с переменной А, значит замена А на B не является адекватной. В случае, когда модель с переменной B заметно улучшит коэффициент, замена переменных А на B является адекватной. Это ваш личный вклад в науку? Это не мой личный вклад в науку, а элементарные базовые принципы, согласно которым те или иные математические методы необходимо применять лишь в тех случаях, когда для этого имеются явные показания. Что такое коэффициент детерминации и в каких случаях его необходимо корректировать, подробно описано в соответствующей справочной литературе без меня, т.е. без моего вклада. Я всего лишь поясняю прописные истины, дабы другие не пытались наступить на грабли, которые Вы советуете подставить под ноги, не разобравшись в вопросе. А в чем принципиальное отличие множественной линейной регресии от парной? С трех раз самостоятельно не можете догадаться? Тогда подскажу: множественная от парной отличается множеством объясняющих переменных, а парная - единственной. Сообщение отредактировал YVR - 21.03.2012 - 08:57 Yury V. Reshetov |
|
21.03.2012 - 14:21
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Квадратный корень из R^2 (коэф. детерминации) в случае парной регрессии - коэффициент корреляции по абсолютному значению. Но коэффициент детерминации менее информативен по сравнению с коэффициентом корреляции, т.к. коэффициент корреляции всегда имеет знак, а коэффициент детерминации его не имеет. Скорректированный может иметь и отрицательное значение, но в случае его отрицательности результаты вообще не стоит принимать во внимание. Т.е. например берем две модели, в одной присутствует независимая переменная А, а во второй переменная А заменяется на переменную B. Вычисляем для этих самых моделей коэффициент детерминации. Если коэффициент значительно выше для модели с переменной А, значит замена А на B не является адекватной. В случае, когда модель с переменной B заметно улучшит коэффициент, замена переменных А на B является адекватной. Это не мой личный вклад в науку, а элементарные базовые принципы, согласно которым те или иные математические методы необходимо применять лишь в тех случаях, когда для этого имеются явные показания. Что такое коэффициент детерминации и в каких случаях его необходимо корректировать, подробно описано в соответствующей справочной литературе без меня, т.е. без моего вклада. Я всего лишь поясняю прописные истины, дабы другие не пытались наступить на грабли, которые Вы советуете подставить под ноги, не разобравшись в вопросе. Цитата Квадратный корень из R^2 (коэф. детерминации) в случае парной регрессии - коэффициент корреляции по абсолютному значению. Но коэффициент детерминации менее информативен по сравнению с коэффициентом корреляции, т.к. коэффициент корреляции всегда имеет знак, а коэффициент детерминации его не имеет. Скорректированный может иметь и отрицательное значение, но в случае его отрицательности результаты вообще не стоит принимать во внимание. Чаще всего корреляционный анализ предшествует регрессионному: сначала устанавливается факт наличия связи между двумя явлениями: определили силу связи (абс. значение и стат. значимость к-та корр.), потом - направление (знак). Затем приступают к моделированию зависимостей. Кроме того, в регрессионном анализе коэф-т корреляции - линейный (Пирсон), применение которого по отношению к балльным шкалам - моветон. А знак коэф-та корреляции в регресиионном анализе н-р, в случае парной линейной регресии определяется знаком коэффициента угла наклона. И вообще в регрессионном анализе вся информация - перед глазами: к-т детерминации R^2, скорректированный R^2 adjusted, значение логарифмической функции правдоподобия, SSR, SER , F- ratio, статистика Дарбина-Уотсона, etc. Вот только сравнивать ее по степени информативности можно только после затянувшегося застолья. Цитата В случаях, когда сравниваемые регрессионные модели имеют одинаковое количество объясняющих переменных, корректировать коэффициент детерминации нет никакой необходимости - это уже эпигонство. В таком случае нескорректированный коэффициент детерминации является более информативным, в особенности когда сравниваемые модели имеют одинаковое количество объясняющих переменных, но эти самые объясняющие переменные различны. Ведь с помощью нескорректированного коэффициента детерминации мы можем адекватно оценить степень влияния объясняющих переменных. Давайте внесем ясность: человек в посте ?1 вывесил три регрессионные модели, отличающиеся разным количеством переменных: парную линейную, параболическую и кубическую и задал вопрос: как выбрать наилучшую? Ему было любезно отвечено. В этой связи предлагаю сократить вашу (интересную) лекцыю до единственного абзаца: Цитата А адекватным применение скорректированного коэффициента детерминации является только лишь в случаях когда сравниваются две или более регрессионные модели, но при этом количество объясняющих переменных в моделях различно. Потому что основное предназначение скорректированного коэффициента детерминации - умалить влияние разности количества переменных, объясняющих зависимую переменную. тем более, что после введения в обиход информационных критериев Акайке, Шварца и Хеннана-Куинна применение скорректированного критерия (R^2 adj) как-то отошло на второй план. Цитата Т.е. например берем две модели, в одной присутствует независимая переменная А, а во второй переменная А заменяется на переменную B. Вычисляем для этих самых моделей коэффициент детерминации. Если коэффициент значительно выше для модели с переменной А, значит замена А на B не является адекватной. В случае, когда модель с переменной B заметно улучшит коэффициент, замена переменных А на B является адекватной. Модель в обоих случаях - одна и та же (парная линейная регрессия). А то, что разные предикторы- так это называется спецификацией модели. То, что две по-разному специфицированные модели обладают разной объясняющей способностью - так я этого и не оспаривал. Цитата С трех раз самостоятельно не можете догадаться? Тогда подскажу: множественная от парной отличается множеством объясняющих переменных, а парная - единственной. То есть по-вашему это принципиально? И последнее. Регрессия - это моделирование условного (по распределению регрессоров) математического ожидания зависимой величины (отклика). У топикстартера и зависимая величина (динамика) и регрессор (тяжесть исходного состояния) - величины, измеренные в порядковой шкале. Оперировать по отношению к ним категорией математического ожидания - не корректно. Следовательно, основная предпосылка регрессионного анализа на выполнена. Это-задача не для линейного регресионного анализа. На это человеку также было указано в посте ?3. В этой связи наш треп в отсутствие топикстартера не стоит выеденного яйца. Предлагаю на этом уняться. Сообщение отредактировал 100$ - 21.03.2012 - 15:32 |
|
21.03.2012 - 14:50
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Нет формулировки цели исследования. Что значит есть две группы с различными методами лечения? Если цель сравнить эффективность двух методов лечения, то нужно начать с того , как эти группы были сформированы, была ли рандомизация или нужно доказывать их сопоставимость по каким то признакам, связанным с прогнозом. Скорее всего, уровень по шкале APACHE II до лечения в группах различался, потому и придумали странное понятие суммарной динамики на конечный этап наблюдения. Как я поняла задачу, нужно оценить степень снижения риска по шкале APACHE II. Сама по себе эта шкала, (полученная по значениям 17 предикторов), является важнейшим предиктором риска смерти, который также рассчитывается в моделях логистической регрессии, куда могут входить и другие предикторы (скорректированный риск). Возможно, цель состоит в том, чтобы найти дополнительные предикторы для повышения чувствительности и специфичности шкалы APACHE II для определенной патологии.
А теперь о том, как сравнивают различия по шкале APACHE II. Да, приводят средние значения по шкале и SD, да, как правило, средние имеют большой разброс данных, как в группах выживших, так и в группах умерших, и даже очень умные журналы и в самых последних номерах используют такой подход. И это не от незнания статистики, а от желания быть понятым. Прежде всего в сравниваемых группах должна быть оценена доля умерших, а как изменилась оценка по APACHE II можно проанализировать для выживших используя дисперсионный анализ для повторных измерений, будет понятно, каковы различия до лечения, в 1 день и на 5 день. Степень изменения ? разность между до и на 5 день в двух группах можно сравнить посредством 95% ДИ, посчитав для этого среднеквадратическую ошибку разности (SD разности выдает Statistica, можно посчитать и m). Можно, конечно использовать и другой статистический подход к анализу различий в группах. Имеется 8 градаций оценки шкалы APACHE II, можно посчитать долю больных с переходом в более низкую градацию в результате лечения в одной и второй группе и сравнить эти доли. Но вряд ли этот подход даст больше информации, чем дисперсионный анализ. Почему не регрессия, по здравому смыслу. Больные с высокими оценками по этой шкале не выживают, у них на много снизить эти оценки просто не получится, а у кого они были низкие, так сильно и не снизишь. А в срединных категориях могут быть переходы на более низкие оценки, и это можно сравнивать в двух группах. |
|
21.03.2012 - 16:22
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Цитата можно проанализировать для выживших используя дисперсионный анализ для повторных измерений, будет понятно, каковы различия до лечения, в 1 день и на 5 день. Степень изменения ? разность между до и на 5 день в двух группах можно сравнить посредством 95% ДИ, посчитав для этого среднеквадратическую ошибку разности (SD разности выдает Statistica, можно посчитать и m). Вообще-то ДА - это всего лишь способ множественного сравнения средних: по сути - тест Стьюдента для 3 и более групп. Так что тестировать балльную шкалу критерием Стьюдента-верный способ попасть к Леонову в его кунсткамеру. Правда, он уже устал над этим хохотать. Поскольку баллы-это квазичисла (порядковая шкала), понятие среднего для них не определено. Так же как не определены арифметические операции в порядковой шкале. Следовательно, разность баллов - неинформативная галиматья: по жизни дистанция от двоечника до троечника не равна расстоянию от хорошиста до троечника, и уж тем более не равна расстоянию от хорошиста до отличника. А разность баллов везде одинакова: 3-2=4-3=5-4. Единственный статистический объект по результатам применения балльной шкалы - ранжировка. Это-объект нечисловой природы. Так что все срочно читаем проф. Орлова. Об успехах сообщайте. О неудачах - тоже. |
|