Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Взаимосвязь корреляционного и регрессионного анализа
Maria85
сообщение 23.08.2016 - 22:11
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 23.08.2016
Пользователь №: 28581



Уважаемые коллеги, никак не могу найти ответ на свой вопрос. Я изучаю влияние признаков на ухудшение прогноза заболевания. При проведении корреляционного анализа выявляется связь ухудшения заболевания с одним признаком, а при построении линейной регрессионной модели она отсутствует, зато появляется связь с другим признаком, с которым не было корреляции, построила рок-кривую для этого же признака довольные приличные значения площади под кривой. Возможно ли это? или же моя регрессионная модель неверно построена, хотя r квадрат показывает достоверность модели. Заранее спасибо за ответы, совсем отчаялась с этой регрессией уже...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Maria85
сообщение 24.08.2016 - 13:03
Сообщение #2





Группа: Пользователи
Сообщений: 4
Регистрация: 23.08.2016
Пользователь №: 28581



Огромное спасибо за ваши ответы.

Цитата(p2004r @ 24.08.2016 - 12:37) *
В регрессию (и логистическую тоже) нельзя помещать коррелированные предикторы. Коэффициенты уравнения становятся численно неустойчивыми и не интерпретируемыми. (Для того что бы представить себе это --- просто поместите какой либо параметр в модель еще раз под другим именем).

Для построения сети зависимостей есть например Bayesian networks (http://www.bnlearn.com/).


Коррелированные между собой нельзя, это я понимаю, а коррелированные с зависимой переменной?


Цитата(100$ @ 24.08.2016 - 12:42) *
Здесь есть одна небольшая, но существенная деталь: единственно возможным статистическим результатом применения любой ординальной (читай: балльной) шкалы является упорядочивание объектов по степени выраженности интересующего исследователя признака, т.е. ранжировка. Она позволяет поставить отличника впереди хорошиста, того- впереди троечника etc., но не позволяет ответить на вопрос, на сколько у одного объекта наблюдения признак выражен сильнее, чем у другого: это связано стем, что порядковая шкала не эквидистантна, и в ней не определена операция суммирования. Соответственно, никакая разница каких-то там баллов просто не имеет право на существование. Поэтому, пользуясь случаем и в надежде, что еще не все потеряно, прошу вас отказаться от использования разницы баллов как зависимой переменной (отклика в линейной регрессии) и не наворачивать одну глупость на другую. Ваши пациенты будут вам очень благодарны.



Конечно, не все потеряно, для этого и спрашиваю совета у знающих людей. Для меня смысл не в разнице баллов, а в разделении пациентов на тех, у кого случилось клиническое ухудшение и на тех, кто остался стабильным. Могу ли я отразить это качественной переменной, где 1- это пациенты без ухудшения, а 2 - с прогрессированием заболевания, и поставить это зависимой переменной в логистическую регрессионную модель?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 24.08.2016 - 13:50
Сообщение #3





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Maria85 @ 24.08.2016 - 13:03) *
Коррелированные между собой нельзя, это я понимаю, а коррелированные с зависимой переменной?


Как не странно, ответ -- некоторые да, а некоторые нет (например если это тренд временного ряда, его сначала придется убрать). Но я уже "содрогаюсь" какие выводы могут быть сделаны из этого smile.gif

Лучше просто сразу писать что за данные имеются (илм, что еще лучше, описать схему-план эксперимента - наблюдения в котором данные получили) и тогда можно сказать что из них можно извлечь. А так это всё "стрельба в сторону леса".


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему