Автор: kont 4.06.2017 - 17:46
Коллеги, подскажите, почему если добавлять-убавлять переменные в регрессионной модели КМД меняется. Тоже самое касается и логистической регрессии, там же нет процента объясненной дисперсии, но значимость модели по хи квадрату, в зависимости от предикторов меняется. Почему так?
Автор: ogurtsov 4.06.2017 - 18:58
Цитата(kont @ 4.06.2017 - 17:46)
Коллеги, подскажите, почему если добавлять-убавлять переменные в регрессионной модели КМД меняется.Тоже самое касается и логистической регрессии, там же нет процента объясненной дисперсии, но значимость модели по хи квадрату, в зависимости от предикторов меняется. Почему так?
Почему R^2 не должен меняться при добавлении переменных в модель регрессии?
А для логистической модели считается не R^2, а псевдо-R^2 (которые бывают разные: https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-pseudo-r-squareds/).
Автор: kont 4.06.2017 - 19:37
Я имел ввиду по каким причинам он меняется
Автор: p2004r 4.06.2017 - 20:16
Цитата(kont @ 4.06.2017 - 19:37)
Я имел ввиду по каким причинам он меняется
Если выборка постоянного размера, то хотя бы из соображения степеней свободы. Дисперсия константа, а ей "нужно заполнить" все большее пространство, что ведет к уменьшению расстояния каждой варианты "в среднем" от найденного "решения".
Автор: kont 5.06.2017 - 19:19
прикол в том, что при добавление переменной, КМД может увеличиваться и уменьшаться.
Автор: ogurtsov 5.06.2017 - 20:24
Цитата(kont @ 5.06.2017 - 19:19)
прикол в том, что при добавление переменной, КМД может увеличиваться и уменьшаться.
Именно R^2? Не adjusted R^2?
Автор: ogurtsov 5.06.2017 - 20:54
Цитата(kont @ 5.06.2017 - 20:36)
да скорректированный КМД
Посмотрите же, как он считается.