![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 18.06.2014 Пользователь №: 26469 ![]() |
Сравниваем две группы пациентов по итогам оценки с помощью порядковой шкалы (0 - признак не выражен, 1 - минимально выражен, 2 - сильно выражен), имеющей более 40 переменных. Применённый критерий Краскела-Уоллиса показывает значимость различий по каждой из сорока переменных. ROC-анализ показывает, что классификатор хороший. Но такая методика слишком большая и нужно оставить не более десяти самых сильных переменных, которые к тому же позволят наилучшим образом предсказать наступление события (бинарная классификация).
Подскажите пожалуйста как в настоящее время принято решать такую задачу? Логистическая регрессия? |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 94 Регистрация: 18.06.2014 Пользователь №: 26469 ![]() |
таблица с порогами - https://basegroup.ru/community/articles/logis-medic-scoring
там пороги 0,25;0,26;0,27... и так до конца прибавляется каждый порог по одной сотой. А если всех по порядку значений нет в моих вероятностях, то можно пропускать значения или нужно всё равно все просчитать прибавляя по одной сотой? Сообщение отредактировал малой - 22.02.2016 - 21:43 |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
таблица с порогами - https://basegroup.ru/community/articles/logis-medic-scoring там пороги 0,25;0,26;0,27... и так до конца прибавляется каждый порог по одной сотой. А если всех по порядку значений нет в моих вероятностях, то можно пропускать значения или нужно всё равно все просчитать прибавляя по одной сотой? График логистической кривой (сигмоида) при любом раскладе пересекает ось ординат в точке ,5. Это - порог по умолчанию. Поэтому, если для пациента рассчитанная вероятность (н-р, ,97044) превышает этот порог, то считаем, что реализовалось событие, закодированное "1"(объект относим к классу "1"), если рассчитанная вероятность меньше порога - событие с кодом "0". ROC-кривая строится в координатах -"Чувствительность - Специфичность", рассчитанных для каждого порога с произвольным шагом (хошь - ,1, хошь -,001,). Желательно отрезок [0;1] разбить на равновеликие интервалы. |
|
![]() |
![]() |
![]() ![]() |