Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Взаимосвязь корреляционного и регрессионного анализа
Maria85
сообщение 23.08.2016 - 22:11
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 23.08.2016
Пользователь №: 28581



Уважаемые коллеги, никак не могу найти ответ на свой вопрос. Я изучаю влияние признаков на ухудшение прогноза заболевания. При проведении корреляционного анализа выявляется связь ухудшения заболевания с одним признаком, а при построении линейной регрессионной модели она отсутствует, зато появляется связь с другим признаком, с которым не было корреляции, построила рок-кривую для этого же признака довольные приличные значения площади под кривой. Возможно ли это? или же моя регрессионная модель неверно построена, хотя r квадрат показывает достоверность модели. Заранее спасибо за ответы, совсем отчаялась с этой регрессией уже...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Maria85
сообщение 24.08.2016 - 13:03
Сообщение #2





Группа: Пользователи
Сообщений: 4
Регистрация: 23.08.2016
Пользователь №: 28581



Огромное спасибо за ваши ответы.

Цитата(p2004r @ 24.08.2016 - 12:37) *
В регрессию (и логистическую тоже) нельзя помещать коррелированные предикторы. Коэффициенты уравнения становятся численно неустойчивыми и не интерпретируемыми. (Для того что бы представить себе это --- просто поместите какой либо параметр в модель еще раз под другим именем).

Для построения сети зависимостей есть например Bayesian networks (http://www.bnlearn.com/).


Коррелированные между собой нельзя, это я понимаю, а коррелированные с зависимой переменной?


Цитата(100$ @ 24.08.2016 - 12:42) *
Здесь есть одна небольшая, но существенная деталь: единственно возможным статистическим результатом применения любой ординальной (читай: балльной) шкалы является упорядочивание объектов по степени выраженности интересующего исследователя признака, т.е. ранжировка. Она позволяет поставить отличника впереди хорошиста, того- впереди троечника etc., но не позволяет ответить на вопрос, на сколько у одного объекта наблюдения признак выражен сильнее, чем у другого: это связано стем, что порядковая шкала не эквидистантна, и в ней не определена операция суммирования. Соответственно, никакая разница каких-то там баллов просто не имеет право на существование. Поэтому, пользуясь случаем и в надежде, что еще не все потеряно, прошу вас отказаться от использования разницы баллов как зависимой переменной (отклика в линейной регрессии) и не наворачивать одну глупость на другую. Ваши пациенты будут вам очень благодарны.



Конечно, не все потеряно, для этого и спрашиваю совета у знающих людей. Для меня смысл не в разнице баллов, а в разделении пациентов на тех, у кого случилось клиническое ухудшение и на тех, кто остался стабильным. Могу ли я отразить это качественной переменной, где 1- это пациенты без ухудшения, а 2 - с прогрессированием заболевания, и поставить это зависимой переменной в логистическую регрессионную модель?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 24.11.2016 - 16:40
Сообщение #3





Группа: Пользователи
Сообщений: 105
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(Maria85 @ 24.08.2016 - 13:03) *
Огромное спасибо за ваши ответы.



Коррелированные между собой нельзя, это я понимаю, а коррелированные с зависимой переменной?


Это заблуждение.
В логистической регрессии есть много разных алгоритмов. И эти алгоритмы как раз позволяют отбирать среди потенциальных предикторов, которые закоррелированы между собой (либо просто взаимосвязаны, т.е. речь идёт не о парах количественных признаков, а о двух других парах: 1) один количественный и один качественный; 2) два качественных признака). Если же все предикторы есть количественные признаки, то можно использовать и дискриминантный анализ. Который, кстати, тоже имеет немало алгоритмов. В частности, учитывающих различные пропорции сравниваемых групп в изучаемой популяции (генеральной совокупности). Примеры отбора таких закоррелированных (взаимосвязанных) предикторов в логистической регрессии можете посмотреть по адресам http://www.biometrica.tomsk.ru/logit_1.htm --- http://www.biometrica.tomsk.ru/logit_9.htm


Конечно, не все потеряно, для этого и спрашиваю совета у знающих людей. Для меня смысл не в разнице баллов, а в разделении пациентов на тех, у кого случилось клиническое ухудшение и на тех, кто остался стабильным. Могу ли я отразить это качественной переменной, где 1- это пациенты без ухудшения, а 2 - с прогрессированием заболевания, и поставить это зависимой переменной в логистическую регрессионную модель?


Да, это возможно. При этом желательно использовать как разные алгоритмы, так и разные наборы потенциальных предикторов.

Сообщение отредактировал leo_biostat - 24.11.2016 - 16:48
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему