Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Значимость бинарного классификатора
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Игорь
Исследуя значимость и ДИ весовых коэффициентов логистической регрессии, построенной на основе медицинских данных, наткнулся на одну не совсем понятную формулу (Hosmer & Lemeshow, p. 35). Итак, Хосмер определяет стандартную ошибку (SE) как (формула 2.5)

SE(Bi) = Sqr (Var(Bi)),

где Bi - оценки коэффициентов,
Var(Bi) - дисперсии коэффициентов Bi,
Sqr - квадратный корень.

Но ведь стандартная ошибка определяется не так. Так определяется стандартное отклонение (SD). Может кто-нибудь пояснить, прав ли Хосмер?
плав
Цитата(Игорь @ 27.06.2008 - 11:58) *
Исследуя значимость и ДИ весовых коэффициентов логистической регрессии, построенной на основе медицинских данных, наткнулся на одну не совсем понятную формулу (Hosmer & Lemeshow, p. 35). Итак, Хосмер определяет стандартную ошибку (SE) как (формула 2.5)

SE(Bi) = Sqr (Var(Bi)),

где Bi - оценки коэффициентов,
Var(Bi) - дисперсии коэффициентов Bi,
Sqr - квадратный корень.

Но ведь стандартная ошибка определяется не так. Так определяется стандартное отклонение (SD). Может кто-нибудь пояснить, прав ли Хосмер?

Не совсем так. Стандартная ошибка не что иное, как стандартное отклонение выборочных средних. Поскольку в данном случае также речь идет о суммарном показателе (коэффициенте регрессии), то его стандартное отклонение вполне правомерно называть стандартной ошибкой.
Игорь
Большое спасибо за пояснение. В расчетах все получается хорошо.
Игорь
Только все-равно непонятно. Ошибка (SE) в "корень квадратный из численности" раз меньше, чем стандартное отклонение (SD). Как же одна величина может заменять другую?
плав
Тут в том в чем дело. SE - это стандартное отклонение в распределении выборочных средних. Согласно Центральной предельной теореме распределение выборочных средних подчиняется нормальному закону вне зависимости от распределения исходной величины в популяции (при достаточно большом n) и при этом этого распределения (стандратное отклонение выборочных средних) в корень из n раз меньше, чем стандартное отклонение самой популяционной величины.
Про центральную предельную теорему забывают и пишут, что "формула для расчета стандартной ошибки..." На самом деле, если Вы сделаете распределение выборочных средних и для него рассчитаете стандартное отклонение (по обычной формуле, только вместо x будут выборочные средние x), то оно окажется в корень из n раз меньше родительского распределения. Но SE - это все равно стандартное отклонение по своей сути (популяции выборочных средних).
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.