Отбор лучших переменных |
Здравствуйте, гость ( Вход | Регистрация )
Отбор лучших переменных |
26.12.2015 - 18:55
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 18.06.2014 Пользователь №: 26469 |
Сравниваем две группы пациентов по итогам оценки с помощью порядковой шкалы (0 - признак не выражен, 1 - минимально выражен, 2 - сильно выражен), имеющей более 40 переменных. Применённый критерий Краскела-Уоллиса показывает значимость различий по каждой из сорока переменных. ROC-анализ показывает, что классификатор хороший. Но такая методика слишком большая и нужно оставить не более десяти самых сильных переменных, которые к тому же позволят наилучшим образом предсказать наступление события (бинарная классификация).
Подскажите пожалуйста как в настоящее время принято решать такую задачу? Логистическая регрессия? |
|
23.02.2016 - 09:09
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
таблица с порогами - https://basegroup.ru/community/articles/logis-medic-scoring там пороги 0,25;0,26;0,27... и так до конца прибавляется каждый порог по одной сотой. А если всех по порядку значений нет в моих вероятностях, то можно пропускать значения или нужно всё равно все просчитать прибавляя по одной сотой? В этой ссылку порогаМИ назвали все значения расчетной вероятности, полученной в модели с большим числом количественных предикторов (табл из MedCalc), возможных комбинаций значений очень много и ничего там не прибавляется по одной сотой, у них есть эти значения и они их представляют, чтобы вы выбрали ПОРОГ, т.е. то значение которое разделит этот ряд на до и после. И к этой точке разделения представляют чувствительность и специфичность. 100$ вам пишет, что когда их много, то можно выбрать шаг, с которым их представлять. По вашей модели нет всех расчетных вероятностей и они не могут быть, нет таких данных. Но они все и не нужны, поскольку нужна только граница раздела. Я не поняла куда вы хотите прибавлять по одной сотой? Вы что хотите решить обратную задачу, по значениям пропущенных вероятностей посчитать какие должны быть предикторы? Иногда в публикациях приводят не одну точку разделения, а две или даже три, чтобы показать какие значения можно использовать и с какими последствиями. |
|