Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Вопрос по основам
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Godesdesad
Обьясните пожалуйста, почему для расчета дисперсии ( и не только ее) сумму квадратов отклонений мы делим на количество измерений -1 а не на количество измерений просто? И как я понял это применяется только для выборки, для расчета дисперсии в генеральной совокупности мы пользуемся общим количеством измерений.
Зарнее спасибо.
DoctorStat
Цитата(Godesdesad @ 24.05.2013 - 09:22) *
почему для расчета дисперсии ( и не только ее) сумму квадратов отклонений мы делим на количество измерений -1 а не на количество измерений просто?
Пусть у нас есть выборка, по которой мы хотим оценить дисперсию какого-то случайного параметра, например, массы тела. Т.к. выборка - это только часть всей совокупности, то нельзя получить точные значения дисперсии, можно только приближенно оценить ее разными способами. Оценки случайных величин делятся на: несмещенные, устойчивые к выбросам и др. Как правило, исследователи предпочитают несмещенные оценки, которые при объеме выборки, стремящейся к бесконечности, сходятся к точным величинам. Вывод формулы несмещенной оценки дисперсии, в которой сумму квадратов отклонений нужно делить на (n-1), а не на n, объясняется в любом учебнике по статистике.
Godesdesad
Спасибо большое!
Вроде разобрался. Тему можно закрыть.
Олег Кравец
Можно я тоже спрошу? Уже спрашивал, но, видимо, базовое математическое образование не дает вникнуть в какие-то тонкости.

Цитата:
=========
Обследовано 50 пациентов *** в возрасте от 22 до 54 лет. Средний возраст больных составил 32,96 плюс минус 10,34 лет.
=========

Не понимаю. Каким образом средний возраст (вычисляемый прямым сложением и делением) может быть интервальным? Объясните, пожалуйста, что имеется в виду под средним значением.
Статистик
Цитата(Олег Кравец @ 22.07.2013 - 14:02) *
Можно я тоже спрошу? Уже спрашивал, но, видимо, базовое математическое образование не дает вникнуть в какие-то тонкости.

Цитата:
=========
Обследовано 50 пациентов *** в возрасте от 22 до 54 лет. Средний возраст больных составил 32,96 плюс минус 10,34 лет.
=========

Не понимаю. Каким образом средний возраст (вычисляемый прямым сложением и делением) может быть интервальным? Объясните, пожалуйста, что имеется в виду под средним значением.

Советую прочитать, например, вторую главу Гланца "Медико-биологическая статистика". Хотя можно и в любой другой книге прочитать.
Если коротко передать основную мысль, то это будет выглядеть так.

Исходя из исходных данных, 10,34 - это стандартное отклонение. Если данные подчинены нормальному закону распределения, то приблизительно 68% значений не будет отклоняться от средней более, чем на величину стандартного отклонения.
Все, что можно посчитать по выборке - это оценки. Например, средняя - это оценка математического ожидания. Такая оценка называется точечной. Но любая оценка имеет свою точность. Например, для измерения точности выборочной средней используется стандартная ошибка средней, которая позволяет оценить точность, с которой выборочная средняя характеризует матожидание.
Кстати, часто в научных статьях по медицине в качестве этого +- указывается не стандартное отклонение, а стандартная ошибка (при этом не указывается, что именно привели в статье).
Если указывается стандартное отклонение, то хотят показать разброс данных, а если стандартная ошибка - то точность оценки.
Олег Кравец
Цитата(Статистик @ 22.07.2013 - 15:34) *
Исходя из исходных данных, 10,34 - это стандартное отклонение. Если данные подчинены нормальному закону распределения, то приблизительно 68% значений не будет отклоняться от средней более, чем на величину стандартного отклонения.
Все, что можно посчитать по выборке - это оценки.


Спасибо, это понятно. На это у меня образования хватает. Непонятно другое: зачем, если дальше в материале не исследуется зависимость чего-либо от возраста?
Статистик
Цитата(Олег Кравец @ 22.07.2013 - 14:53) *
Спасибо, это понятно. На это у меня образования хватает. Непонятно другое: зачем, если дальше в материале не исследуется зависимость чего-либо от возраста?

Мне сложно ответить на Ваш вопрос, не видя весь материал.
Но часто возраст приводят как раз для того, чтобы показать, что по возрасту сравниваемые выборки однородны. Т.е. изменение исследуемых показателей от возраста в группах не зависит.
Олег Кравец
Цитата(Статистик @ 22.07.2013 - 16:04) *
Но часто возраст приводят как раз для того, чтобы показать, что по возрасту сравниваемые выборки однородны. Т.е. изменение исследуемых показателей от возраста в группах не зависит.


И поэтому указывается сигма? Занятно. Дальше в материале возраст не используется и в явном виде не учитывается. А разве можно на основании приведенных мной стартовых данных сделать заключение об однородности выборки?
Статистик
Цитата(Олег Кравец @ 22.07.2013 - 15:11) *
И поэтому указывается сигма? Занятно. Дальше в материале возраст не используется и в явном виде не учитывается. А разве можно на основании приведенных мной стартовых данных сделать заключение об однородности выборки?

Еще раз повторю, я не вижу весь текст, поэтому это только мои предположения. По Вашим стартовым данным вообще ни о чем говорить нельзя, кроме как о том, что в качестве +- указана сигма.
Проверяется не однородность одной выборки, а однородность, например, двух выборок. Т.е. обычно показывается (при том с проверкой соответствующих гипотез), что в обе сравниваемые межу собой выборки (например, контрольная группа и группа лечения) однородны по возрасту.
Вы же изначально спрашивали совершенно другое. Вы спросили, как от точечной оценки перешли к интервалу.
Олег Кравец
Понятно, спасибо.
100$
Цитата
Не понимаю. Каким образом средний возраст (вычисляемый прямым сложением и делением) может быть интервальным? Объясните, пожалуйста, что имеется в виду под средним значением.


Ответ на ваш вопрос упирается в природу данных: если это пригоршня алгебраических чисел (т.е. математическая абстракция в чистом виде), то их средняя арифметическая будет (единственным!) числом.
Если же данные представляют собой набор случайных величин, то ... сами понимаете.

А средняя величина в статистике это:
а) обобщающая статистическая величина
б) состоятельная оценка мат. ожидания сл. вел-ны
в) оценка центра распределения с.в.
или любая линейная комбинация из этих пунктов.
amr
Здравствуйте, коллеги. У меня такой вопрос:мне нужно определить зависимость уровня качества жизни (определено в баллах) от выявленных у пациентов факторов. Подскажите, пожалуйста, какой метод для этого лучше использовать.
anserovtv
Нужно знать структуру факторов: сколько и какого они типа.
Нужно знать также , будете ли вы оценивать взаимодействия факторов или нет.
Какой тест применялся, стандартен ли он?
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.