Здравствуйте, гость ( Вход | Регистрация )
23.08.2016 - 22:11
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 23.08.2016 Пользователь №: 28581 |
Уважаемые коллеги, никак не могу найти ответ на свой вопрос. Я изучаю влияние признаков на ухудшение прогноза заболевания. При проведении корреляционного анализа выявляется связь ухудшения заболевания с одним признаком, а при построении линейной регрессионной модели она отсутствует, зато появляется связь с другим признаком, с которым не было корреляции, построила рок-кривую для этого же признака довольные приличные значения площади под кривой. Возможно ли это? или же моя регрессионная модель неверно построена, хотя r квадрат показывает достоверность модели. Заранее спасибо за ответы, совсем отчаялась с этой регрессией уже...
|
|
|
![]() |
![]() |
![]() |
24.08.2016 - 08:46
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 |
Уважаемые коллеги, никак не могу найти ответ на свой вопрос. Я изучаю влияние признаков на ухудшение прогноза заболевания. При проведении корреляционного анализа выявляется связь ухудшения заболевания с одним признаком, а при построении линейной регрессионной модели она отсутствует, зато появляется связь с другим признаком, с которым не было корреляции, построила рок-кривую для этого же признака довольные приличные значения площади под кривой. Возможно ли это? или же моя регрессионная модель неверно построена, хотя r квадрат показывает достоверность модели. Заранее спасибо за ответы, совсем отчаялась с этой регрессией уже... Из этого описания нельзя понять, что с чем коррелирует, и как вообще выполняется анализ. Но то, что разные модели приводят к разным выводам - это нормально. Ни корреляция, ни регрессионный анализ ничего не говорят о причинности. Два показателя, между которыми есть сильная и значимая корреляция, могут одновременно изменяться под влиянием третьего показателя. R^2 не может показывать достоверность модели. Достоверность - это вероятность возникновения события, равная 1; достоверным может быть восход Солнца, но не статистическая модель. И значимость R^2 тоже не показывает. ![]() |
|
|
![]() |
![]() |
24.08.2016 - 10:02
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 23.08.2016 Пользователь №: 28581 |
Из этого описания нельзя понять, что с чем коррелирует, и как вообще выполняется анализ. Но то, что разные модели приводят к разным выводам - это нормально. Ни корреляция, ни регрессионный анализ ничего не говорят о причинности. Два показателя, между которыми есть сильная и значимая корреляция, могут одновременно изменяться под влиянием третьего показателя. R^2 не может показывать достоверность модели. Достоверность - это вероятность возникновения события, равная 1; достоверным может быть восход Солнца, но не статистическая модель. И значимость R^2 тоже не показывает. Спасибо большое за ваш ответ!! У меня есть группа пациентов с рассеянным склерозом, которых наблюдали в течении двух лет. Мне важно знать влияние определенных факторов на прогрессирование заболевания, чтобы можно было предсказывать прогноз развития заболевания пациентам на начальной стадии. С этой целью я и хочу провести регрессионный анализ. Моей зависимой переменной является разница баллов по шкале, отражающей клиническое состояние пациентов. Но при проведении корреляционного анализа определяется корреляция между изменением баллов по шкале клинического состояния с одним фактором, а при проведении регрессии этих же данных с другим фактором, с которым не было корреляции. Я перевела данные шкалы в качественный признак, попробовала сделать логистическую регрессию, но результат такой же. Просто мне всегда казалось, что регрессионный анализ определяет сильнейшую из корреляций, поэтому показалось странным отсутствие корреляций с этим фактором. Еще такой момент, мои данные распределены ненормально, может мне нужно сделать их трансформацию для построения логистической модели? Про R квадрат поняла, больше не буду так говорить! |
|
|
![]() |
![]() |
24.08.2016 - 12:42
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Моей зависимой переменной является разница баллов по шкале, отражающей клиническое состояние пациентов... Здесь есть одна небольшая, но существенная деталь: единственно возможным статистическим результатом применения любой ординальной (читай: балльной) шкалы является упорядочивание объектов по степени выраженности интересующего исследователя признака, т.е. ранжировка. Она позволяет поставить отличника впереди хорошиста, того- впереди троечника etc., но не позволяет ответить на вопрос, на сколько у одного объекта наблюдения признак выражен сильнее, чем у другого: это связано стем, что порядковая шкала не эквидистантна, и в ней не определена операция суммирования. Соответственно, никакая разница каких-то там баллов просто не имеет право на существование. Поэтому, пользуясь случаем и в надежде, что еще не все потеряно, прошу вас отказаться от использования разницы баллов как зависимой переменной (отклика в линейной регрессии) и не наворачивать одну глупость на другую. Ваши пациенты будут вам очень благодарны. Сообщение отредактировал 100$ - 24.08.2016 - 12:43 |
|
|
![]() |
![]() |
Maria85 Взаимосвязь корреляционного и регрессионного анализа 23.08.2016 - 22:11
ogurtsov Цитата(Maria85 @ 24.08.2016 - 10:02)... 24.08.2016 - 12:00
p2004r Цитата(Maria85 @ 24.08.2016 - 10:02)... 24.08.2016 - 12:37
Maria85 Огромное спасибо за ваши ответы.
Цитата(p2004r ... 24.08.2016 - 13:03
100$ Цитата(Maria85 @ 24.08.2016 - 13:03)... 24.08.2016 - 13:14
p2004r Цитата(Maria85 @ 24.08.2016 - 13:03)... 24.08.2016 - 13:50
Maria85 Цитата(p2004r @ 24.08.2016 - 13:50) ... 24.08.2016 - 14:15
p2004r Цитата(Maria85 @ 24.08.2016 - 14:15)... 25.08.2016 - 20:24
leo_biostat Цитата(Maria85 @ 24.08.2016 - 13:03)... 24.11.2016 - 16:40![]() ![]() |