![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 10.05.2017 Пользователь №: 29790 ![]() |
Здравствуйте! Подскажите при создании прогнозной модели при помощи логистической регрессии сколько наблюдений достаточно для одной переменной? По разным источникам встречала от 20 до 100, то есть соответственно объем выборки должен быть больше. У меня в исследовании 410 человек, при создании прогнозной модели в нее были изначально включены переменные оказывающие влияние на прогноз - 20 переменных. В результате логистической регрессии в уравнение вошли 9 переменных (достаточная специфичности и чувствительность). Не слишком ли много для такой выборки? При исключении какой-либо переменной качество модели ухудшается.
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 ![]() |
Оптимальная модель обычно подбирается при помощи перекрестной проверки (cross-validation).
Какая модель дает наилучшее качество, такую и используйте; количеством переменных себя заранее ограничивать не нужно. Отбор информативных признаков - другая задача, и еще одна задача - понижение размерности. Затем качество итоговой модели проверяется на еще одной отложенной выборке. ![]() |
|
![]() |
![]() |
![]() ![]() |