Здравствуйте, гость ( Вход | Регистрация )
23.08.2016 - 22:11
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 23.08.2016 Пользователь №: 28581 |
Уважаемые коллеги, никак не могу найти ответ на свой вопрос. Я изучаю влияние признаков на ухудшение прогноза заболевания. При проведении корреляционного анализа выявляется связь ухудшения заболевания с одним признаком, а при построении линейной регрессионной модели она отсутствует, зато появляется связь с другим признаком, с которым не было корреляции, построила рок-кривую для этого же признака довольные приличные значения площади под кривой. Возможно ли это? или же моя регрессионная модель неверно построена, хотя r квадрат показывает достоверность модели. Заранее спасибо за ответы, совсем отчаялась с этой регрессией уже...
|
|
|
![]() |
![]() |
![]() |
24.08.2016 - 13:03
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 23.08.2016 Пользователь №: 28581 |
Огромное спасибо за ваши ответы.
В регрессию (и логистическую тоже) нельзя помещать коррелированные предикторы. Коэффициенты уравнения становятся численно неустойчивыми и не интерпретируемыми. (Для того что бы представить себе это --- просто поместите какой либо параметр в модель еще раз под другим именем). Для построения сети зависимостей есть например Bayesian networks (http://www.bnlearn.com/). Коррелированные между собой нельзя, это я понимаю, а коррелированные с зависимой переменной? Здесь есть одна небольшая, но существенная деталь: единственно возможным статистическим результатом применения любой ординальной (читай: балльной) шкалы является упорядочивание объектов по степени выраженности интересующего исследователя признака, т.е. ранжировка. Она позволяет поставить отличника впереди хорошиста, того- впереди троечника etc., но не позволяет ответить на вопрос, на сколько у одного объекта наблюдения признак выражен сильнее, чем у другого: это связано стем, что порядковая шкала не эквидистантна, и в ней не определена операция суммирования. Соответственно, никакая разница каких-то там баллов просто не имеет право на существование. Поэтому, пользуясь случаем и в надежде, что еще не все потеряно, прошу вас отказаться от использования разницы баллов как зависимой переменной (отклика в линейной регрессии) и не наворачивать одну глупость на другую. Ваши пациенты будут вам очень благодарны. Конечно, не все потеряно, для этого и спрашиваю совета у знающих людей. Для меня смысл не в разнице баллов, а в разделении пациентов на тех, у кого случилось клиническое ухудшение и на тех, кто остался стабильным. Могу ли я отразить это качественной переменной, где 1- это пациенты без ухудшения, а 2 - с прогрессированием заболевания, и поставить это зависимой переменной в логистическую регрессионную модель? |
|
|
![]() |
![]() |
24.11.2016 - 16:40
Сообщение
#3
|
|
![]() Группа: Пользователи Сообщений: 105 Регистрация: 23.11.2016 Пользователь №: 28953 |
Огромное спасибо за ваши ответы. Коррелированные между собой нельзя, это я понимаю, а коррелированные с зависимой переменной? Это заблуждение. В логистической регрессии есть много разных алгоритмов. И эти алгоритмы как раз позволяют отбирать среди потенциальных предикторов, которые закоррелированы между собой (либо просто взаимосвязаны, т.е. речь идёт не о парах количественных признаков, а о двух других парах: 1) один количественный и один качественный; 2) два качественных признака). Если же все предикторы есть количественные признаки, то можно использовать и дискриминантный анализ. Который, кстати, тоже имеет немало алгоритмов. В частности, учитывающих различные пропорции сравниваемых групп в изучаемой популяции (генеральной совокупности). Примеры отбора таких закоррелированных (взаимосвязанных) предикторов в логистической регрессии можете посмотреть по адресам http://www.biometrica.tomsk.ru/logit_1.htm --- http://www.biometrica.tomsk.ru/logit_9.htm Конечно, не все потеряно, для этого и спрашиваю совета у знающих людей. Для меня смысл не в разнице баллов, а в разделении пациентов на тех, у кого случилось клиническое ухудшение и на тех, кто остался стабильным. Могу ли я отразить это качественной переменной, где 1- это пациенты без ухудшения, а 2 - с прогрессированием заболевания, и поставить это зависимой переменной в логистическую регрессионную модель? Да, это возможно. При этом желательно использовать как разные алгоритмы, так и разные наборы потенциальных предикторов. Сообщение отредактировал leo_biostat - 24.11.2016 - 16:48 |
|
|
![]() |
![]() |
Maria85 Взаимосвязь корреляционного и регрессионного анализа 23.08.2016 - 22:11
ogurtsov Цитата(Maria85 @ 23.08.2016 - 22:11)... 24.08.2016 - 08:46
Maria85 Цитата(ogurtsov @ 24.08.2016 - 08:46... 24.08.2016 - 10:02
ogurtsov Цитата(Maria85 @ 24.08.2016 - 10:02)... 24.08.2016 - 12:00
p2004r Цитата(Maria85 @ 24.08.2016 - 10:02)... 24.08.2016 - 12:37
100$ Цитата(Maria85 @ 24.08.2016 - 10:02)... 24.08.2016 - 12:42
100$ Цитата(Maria85 @ 24.08.2016 - 13:03)... 24.08.2016 - 13:14
p2004r Цитата(Maria85 @ 24.08.2016 - 13:03)... 24.08.2016 - 13:50
Maria85 Цитата(p2004r @ 24.08.2016 - 13:50) ... 24.08.2016 - 14:15
p2004r Цитата(Maria85 @ 24.08.2016 - 14:15)... 25.08.2016 - 20:24![]() ![]() |