Отбор лучших переменных |
Здравствуйте, гость ( Вход | Регистрация )
Отбор лучших переменных |
26.12.2015 - 18:55
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 18.06.2014 Пользователь №: 26469 |
Сравниваем две группы пациентов по итогам оценки с помощью порядковой шкалы (0 - признак не выражен, 1 - минимально выражен, 2 - сильно выражен), имеющей более 40 переменных. Применённый критерий Краскела-Уоллиса показывает значимость различий по каждой из сорока переменных. ROC-анализ показывает, что классификатор хороший. Но такая методика слишком большая и нужно оставить не более десяти самых сильных переменных, которые к тому же позволят наилучшим образом предсказать наступление события (бинарная классификация).
Подскажите пожалуйста как в настоящее время принято решать такую задачу? Логистическая регрессия? |
|
22.02.2016 - 01:44
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Можно использовать и полученные малым коэффициенты, при этом прогнозируется "0" здоровые и Z=-0,07746-(0,28567*15)+0,87103=-3,49148 exp(3,49148)=32,834506 р=0,029555 , и наконец, вероятность повтора суицида 1-0,029555=0,97044 , что и следовало показать. В данном случае бинарная переменная имеющая значение "0" использует ко?ффициент, а имеющая значение "1" нет. И может теперь будет понятно, что на 2 не нужно умножать коэффициент для ранговой переменной.
|
|
22.02.2016 - 18:10
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Можно использовать и полученные малым коэффициенты, при этом прогнозируется "0" здоровые и Z=-0,07746-(0,28567*15)+0,87103=-3,49148 exp(3,49148)=32,834506 р=0,029555 , и наконец, вероятность повтора суицида 1-0,029555=0,97044 , что и следовало показать. В данном случае бинарная переменная имеющая значение "0" использует ко?ффициент, а имеющая значение "1" нет. И может теперь будет понятно, что на 2 не нужно умножать коэффициент для ранговой переменной. Ну нормальные переменные представляющие уровни факторов вводятся через контрасты и не имеют избыточности (3 уровня - 2 "думми" в контрасте). Тогда правда все чешут репу как собрать из контрастов опять "общие коэффициенты" |
|