Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Кто знает специальный коэффициент для расчета стандартной ошибки средней?
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Ната
Люди, плиз, помогите! Без вас не справиться! Вышла вот какая "оказия": сотрудница "помогла чем смогла", подсунула таблицу на листе А4, сроком давности лет 300 (как я позже выяснила, но уже поздно...) Название таблицы таково "Коэффициенты Км для рассчета стандартной ошибки средней (М) по размаху рар.....вания" (здесь стерлась надпись и непонятно что за слово, на ранжирование не похоже). Приведены значения неизвестного мне коэфициента "К корень квадратный из n" в зависимости от числа наблюдений. Ошибка расситывается М макс-Ммин/ делить на этот коэффициент.

Теперь суть проблемы: я расчитала свой набранный материал по этой таблице, довольная такая... Потом думаю, дай проверю по книжным формулам, а результаты то отличаются (ошибки и сигмы)! Спросила у коллеги откуда она взяла таблицу, а она то и не помнит... frown.gif Что делать? Опять все пересчитывать заново, ой как жалко своих трудов! Я понимаю что вопрос "туповат", но может кто-нибудь что-то знает про эти коэффициенты?
плав
А не проще ввести свои данные в статистическую программу, где все и рассчитывать, тем более, что по судя по другим постам Вам все равно без моделей не обойтись frown.gif
Теперь к самому вопросу - можеть быть, слово там "варьирования". Попробуйте проверить так: возьмите большое N (например, 10000) затем посмотрите, чему равен этот Км если он равен 16,7 или около того (или для 100 наблюдений в диапазон 1,7 - 2,5), то идея здесь такова - минимальное и максимальное значения равны амплитуде значений. Амплитуда для большого числа наблюдений +/- 3 сигмы (+/-2 сигмы для малого числа наблюдений) соответственно сигма - амплитуда / 6 (или 4). Ошибка среднего равна сигма/корень(N), соответственно, для большого числа наблюдений K равно корень(N)/6.
Небольшой поиск с учетом Вашей специальности позволил найти книгу "Статистика в гигиенических исследованиях" (Медицина, 1965), где приводится метод экспресс-оценки средних величин концентрации по таблицам С.И.Ермолаева. Он действительно, построен на том принципе, что я подумал, сигма=ампл/К, где К=для 100 - 5,02, для 70 - 4,75, для 50 - 4,50 ошибка среднего рассчитывается путем деления полученной "сигмы" на квадратный корень из числа наблюдений.
Игорь
Не совсем понятно, что такое "Размах варьирования". Предложу версию, откуда всё это взялось.

Стандартная ошибка, как известно, вычисляется по формуле
m = s / sqr(n),
где s - стандартное отклонение,
sqr(.) - квадратный корень,
n - численность выборки.

Точечная оценка стандартного отклонения нормально распределенной совокупности может быть вычислена следующим способом
s = f / 2 F(0,75),
где f - межквартильный размах,
F(.) - функция, обратная функции стандартного нормального распределения.
Подставив значение F(0,75), получим
s = 0,741301f.

Нетрудно заметить, откуда мог взяться упомянутый коэффициент K и чему он равен.

В свою очередь, межквартильный размах равен
f = f3/4 - f1/4,
где f3/4 - значение верхней квартили выборки,
f1/4 - значение нижней квартили.

Напомним, что квартили, а также медиана (50% процентиль) обеспечивают разбиение упорядоченной количественной выборки (в виде вариационного ряда) на 4 подмножества равной численности. Практически вычисление квартилей производится по правилам, принятым для вычисления медианы.
плав
Все это здорово, только вот старые источники не очень жаловали межквартильные расстояния, а размах варьирования не что иное, как амплитуда (или просто размах) - обратите внимание, что в вопросе указано, что в формуле берется максимальное и минимальное значения. А так можно взять любое деление - почему надо делить на четыре части, а не на три? Можно воспользоваться терцилями (межтерцильное расстояние округленно равно s)? Или на пять - квинтилями? (s/2) Проблема, однако, в том, что для всех этих методов надо сортировать данные, а это, если у вас более 10 наблюдений уже неудобно. Найти максимум и минимум значительно проще, именно поэтому прикидочные методы оценки стандартного отклонения полагаются именно на них (например, когда надо быстро найти неизвестную сигму при планировании эксперимента, см. Knapp, Miller, 1992)
http://uborshizzza.livejou
В дикое докомпьютерное время, когда считать было тяжело, часто использовались приблизительные методы расчета оценок параметров. Один из вариантов - оценка среднеквадратичных отклонений и стат. погрешностей среднего по размаху (то есть разнице между максимальным и минимальным значениями) и т.п. Делать этого категорически нельзя - такие оценки справедливы только для нормально распределенных случайных величин. Для реальных:
а) Возможны сильные ошибки
б) В этом случае нужно доказывать нормальность изучаемых распределений (что заведомо окажется неверным)
плав
Цитата(http://uborshizzza.livejou @ 26.08.2007 - 21:29) [snapback]3199[/snapback]
В дикое докомпьютерное время, когда считать было тяжело, часто использовались приблизительные методы расчета оценок параметров. Один из вариантов - оценка среднеквадратичных отклонений и стат. погрешностей среднего по размаху (то есть разнице между максимальным и минимальным значениями) и т.п. Делать этого категорически нельзя - такие оценки справедливы только для нормально распределенных случайных величин. Для реальных:
а) Возможны сильные ошибки
б) В этом случае нужно доказывать нормальность изучаемых распределений (что заведомо окажется неверным)


А почему распределение "заведомо" будет ненормальным? На основании анализа выборки? Так вот, самая частая ошибка - как раз определять нормальность распределения по малочисленной выборке...
А вот определение стандартного отклонения по размаху очень даже разумный подход при планировании пилотных исследований, когда данных - даже выборочных - нет. Иного варианта просто не существует - надо определить количество пациентов для включения в исследование. Возможные колебания (размах данных) известен или предполагаем (размах, кстати, определить проще, чем SD). Скорее всего произойдет ошибка и оценка SD будет немного больше (если есть страх ненормальности - можно использовать неравенство Чебышева, тогда SD будет еще больше). Однако численность будет определена (количество пациентов будет большим, чем оптимальное, но все равно лучше, чем гадание на кофейной гуще).
http://uborshizzza.livejou
Отвечаю про ненормальность и нормальность распределений.

Дело в том, что по имеющейся выборке доказать нормальность наблюдаемой случайной величины нельзя в принципе. Можно сделать только обратное - доказать ненормальность.

Поэтому в таких расчетах всегда будет использоваться предположение, про которое или доказано, что оно неверно, или недоказано, что оно верно.


ОБРАЩЕНИЕ К МОДЕРАТОРУ _ ПОЧТИ OFFTOP_
Будет ли этично выложить указание на свою вышедшую книгу «Медицинская статистика». Если да, то куда это лучше сделать?

Будет ли этично указать ссылку на свои материалы в блоге с практикумами по статобработке медицинских данных в Excel и SPSS. Если да, то куда это лучше сделать?


плав
Я думаю, давайте создадим ветку "В помощь пользователям - от авторов" и туда будем помещать информацию со ссылками на собственные творения, при этом читателям будет понятно, что это - в некоторой степени - рекламные материалы.
Насчет предположения о ненормальности как основного - не могу согласиться. Вы были бы правы, если бы существовало "ненормальное" распределение. на самом деле - это огромное количество очень разных распределений. Поэтому, отвергнув гипотезу о нормальности у Вас все равно проблема - какое распределение имеется в этих данных.
Кроме того, проверяя нормальность распределения Вы все равно можете сделать ошибку. При этом, чем выше априорная вероятность нормального распределения данных (строго говоря - случайность разброса данных), тем выше эта вероятность этой ошибки. Мощность тестов для определения нормальности не очень высока, поэтому это - серьезная проблема - я уже приводил ранее результаты вычислительного эксперимента на эту тему.
И последнее, по выборке нельзя доказать нормальность. Но и доказать не нормальность тоже нельзя.
Ната
Спасибо за ответы, я уже нашла этот коэффициент
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.