Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Взаимосвязь корреляционного и регрессионного анализа
Maria85
сообщение 23.08.2016 - 22:11
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 23.08.2016
Пользователь №: 28581



Уважаемые коллеги, никак не могу найти ответ на свой вопрос. Я изучаю влияние признаков на ухудшение прогноза заболевания. При проведении корреляционного анализа выявляется связь ухудшения заболевания с одним признаком, а при построении линейной регрессионной модели она отсутствует, зато появляется связь с другим признаком, с которым не было корреляции, построила рок-кривую для этого же признака довольные приличные значения площади под кривой. Возможно ли это? или же моя регрессионная модель неверно построена, хотя r квадрат показывает достоверность модели. Заранее спасибо за ответы, совсем отчаялась с этой регрессией уже...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
ogurtsov
сообщение 24.08.2016 - 08:46
Сообщение #2





Группа: Пользователи
Сообщений: 127
Регистрация: 15.12.2015
Пользователь №: 27760



Цитата(Maria85 @ 23.08.2016 - 22:11) *
Уважаемые коллеги, никак не могу найти ответ на свой вопрос. Я изучаю влияние признаков на ухудшение прогноза заболевания. При проведении корреляционного анализа выявляется связь ухудшения заболевания с одним признаком, а при построении линейной регрессионной модели она отсутствует, зато появляется связь с другим признаком, с которым не было корреляции, построила рок-кривую для этого же признака довольные приличные значения площади под кривой. Возможно ли это? или же моя регрессионная модель неверно построена, хотя r квадрат показывает достоверность модели. Заранее спасибо за ответы, совсем отчаялась с этой регрессией уже...

Из этого описания нельзя понять, что с чем коррелирует, и как вообще выполняется анализ.
Но то, что разные модели приводят к разным выводам - это нормально.
Ни корреляция, ни регрессионный анализ ничего не говорят о причинности. Два показателя, между которыми есть сильная и значимая корреляция, могут одновременно изменяться под влиянием третьего показателя.
R^2 не может показывать достоверность модели. Достоверность - это вероятность возникновения события, равная 1; достоверным может быть восход Солнца, но не статистическая модель. И значимость R^2 тоже не показывает.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Maria85
сообщение 24.08.2016 - 10:02
Сообщение #3





Группа: Пользователи
Сообщений: 4
Регистрация: 23.08.2016
Пользователь №: 28581



Цитата(ogurtsov @ 24.08.2016 - 08:46) *
Из этого описания нельзя понять, что с чем коррелирует, и как вообще выполняется анализ.
Но то, что разные модели приводят к разным выводам - это нормально.
Ни корреляция, ни регрессионный анализ ничего не говорят о причинности. Два показателя, между которыми есть сильная и значимая корреляция, могут одновременно изменяться под влиянием третьего показателя.
R^2 не может показывать достоверность модели. Достоверность - это вероятность возникновения события, равная 1; достоверным может быть восход Солнца, но не статистическая модель. И значимость R^2 тоже не показывает.



Спасибо большое за ваш ответ!! У меня есть группа пациентов с рассеянным склерозом, которых наблюдали в течении двух лет. Мне важно знать влияние определенных факторов на прогрессирование заболевания, чтобы можно было предсказывать прогноз развития заболевания пациентам на начальной стадии. С этой целью я и хочу провести регрессионный анализ. Моей зависимой переменной является разница баллов по шкале, отражающей клиническое состояние пациентов. Но при проведении корреляционного анализа определяется корреляция между изменением баллов по шкале клинического состояния с одним фактором, а при проведении регрессии этих же данных с другим фактором, с которым не было корреляции. Я перевела данные шкалы в качественный признак, попробовала сделать логистическую регрессию, но результат такой же. Просто мне всегда казалось, что регрессионный анализ определяет сильнейшую из корреляций, поэтому показалось странным отсутствие корреляций с этим фактором. Еще такой момент, мои данные распределены ненормально, может мне нужно сделать их трансформацию для построения логистической модели? Про R квадрат поняла, больше не буду так говорить!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 24.08.2016 - 12:37
Сообщение #4





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Maria85 @ 24.08.2016 - 10:02) *
Спасибо большое за ваш ответ!! У меня есть группа пациентов с рассеянным склерозом, которых наблюдали в течении двух лет. Мне важно знать влияние определенных факторов на прогрессирование заболевания, чтобы можно было предсказывать прогноз развития заболевания пациентам на начальной стадии. С этой целью я и хочу провести регрессионный анализ. Моей зависимой переменной является разница баллов по шкале, отражающей клиническое состояние пациентов. Но при проведении корреляционного анализа определяется корреляция между изменением баллов по шкале клинического состояния с одним фактором, а при проведении регрессии этих же данных с другим фактором, с которым не было корреляции. Я перевела данные шкалы в качественный признак, попробовала сделать логистическую регрессию, но результат такой же. Просто мне всегда казалось, что регрессионный анализ определяет сильнейшую из корреляций, поэтому показалось странным отсутствие корреляций с этим фактором. Еще такой момент, мои данные распределены ненормально, может мне нужно сделать их трансформацию для построения логистической модели? Про R квадрат поняла, больше не буду так говорить!


В регрессию (и логистическую тоже) нельзя помещать коррелированные предикторы. Коэффициенты уравнения становятся численно неустойчивыми и не интерпретируемыми. (Для того что бы представить себе это --- просто поместите какой либо параметр в модель еще раз под другим именем).

Для построения сети зависимостей есть например Bayesian networks (http://www.bnlearn.com/).


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему