Кто знает специальный коэффициент для расчета стандартной ошибки средней?, средние величины |
Здравствуйте, гость ( Вход | Регистрация )
Кто знает специальный коэффициент для расчета стандартной ошибки средней?, средние величины |
6.06.2007 - 22:03
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 32 Регистрация: 23.02.2007 Пользователь №: 3956 |
Люди, плиз, помогите! Без вас не справиться! Вышла вот какая "оказия": сотрудница "помогла чем смогла", подсунула таблицу на листе А4, сроком давности лет 300 (как я позже выяснила, но уже поздно...) Название таблицы таково "Коэффициенты Км для рассчета стандартной ошибки средней (М) по размаху рар.....вания" (здесь стерлась надпись и непонятно что за слово, на ранжирование не похоже). Приведены значения неизвестного мне коэфициента "К корень квадратный из n" в зависимости от числа наблюдений. Ошибка расситывается М макс-Ммин/ делить на этот коэффициент.
Теперь суть проблемы: я расчитала свой набранный материал по этой таблице, довольная такая... Потом думаю, дай проверю по книжным формулам, а результаты то отличаются (ошибки и сигмы)! Спросила у коллеги откуда она взяла таблицу, а она то и не помнит... Что делать? Опять все пересчитывать заново, ой как жалко своих трудов! Я понимаю что вопрос "туповат", но может кто-нибудь что-то знает про эти коэффициенты? Туся
|
|
6.06.2007 - 22:23
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
А не проще ввести свои данные в статистическую программу, где все и рассчитывать, тем более, что по судя по другим постам Вам все равно без моделей не обойтись
Теперь к самому вопросу - можеть быть, слово там "варьирования". Попробуйте проверить так: возьмите большое N (например, 10000) затем посмотрите, чему равен этот Км если он равен 16,7 или около того (или для 100 наблюдений в диапазон 1,7 - 2,5), то идея здесь такова - минимальное и максимальное значения равны амплитуде значений. Амплитуда для большого числа наблюдений +/- 3 сигмы (+/-2 сигмы для малого числа наблюдений) соответственно сигма - амплитуда / 6 (или 4). Ошибка среднего равна сигма/корень(N), соответственно, для большого числа наблюдений K равно корень(N)/6. Небольшой поиск с учетом Вашей специальности позволил найти книгу "Статистика в гигиенических исследованиях" (Медицина, 1965), где приводится метод экспресс-оценки средних величин концентрации по таблицам С.И.Ермолаева. Он действительно, построен на том принципе, что я подумал, сигма=ампл/К, где К=для 100 - 5,02, для 70 - 4,75, для 50 - 4,50 ошибка среднего рассчитывается путем деления полученной "сигмы" на квадратный корень из числа наблюдений. |
|
8.06.2007 - 10:23
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Не совсем понятно, что такое "Размах варьирования". Предложу версию, откуда всё это взялось.
Стандартная ошибка, как известно, вычисляется по формуле m = s / sqr(n), где s - стандартное отклонение, sqr(.) - квадратный корень, n - численность выборки. Точечная оценка стандартного отклонения нормально распределенной совокупности может быть вычислена следующим способом s = f / 2 F(0,75), где f - межквартильный размах, F(.) - функция, обратная функции стандартного нормального распределения. Подставив значение F(0,75), получим s = 0,741301f. Нетрудно заметить, откуда мог взяться упомянутый коэффициент K и чему он равен. В свою очередь, межквартильный размах равен f = f3/4 - f1/4, где f3/4 - значение верхней квартили выборки, f1/4 - значение нижней квартили. Напомним, что квартили, а также медиана (50% процентиль) обеспечивают разбиение упорядоченной количественной выборки (в виде вариационного ряда) на 4 подмножества равной численности. Практически вычисление квартилей производится по правилам, принятым для вычисления медианы. Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
8.06.2007 - 20:02
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Все это здорово, только вот старые источники не очень жаловали межквартильные расстояния, а размах варьирования не что иное, как амплитуда (или просто размах) - обратите внимание, что в вопросе указано, что в формуле берется максимальное и минимальное значения. А так можно взять любое деление - почему надо делить на четыре части, а не на три? Можно воспользоваться терцилями (межтерцильное расстояние округленно равно s)? Или на пять - квинтилями? (s/2) Проблема, однако, в том, что для всех этих методов надо сортировать данные, а это, если у вас более 10 наблюдений уже неудобно. Найти максимум и минимум значительно проще, именно поэтому прикидочные методы оценки стандартного отклонения полагаются именно на них (например, когда надо быстро найти неизвестную сигму при планировании эксперимента, см. Knapp, Miller, 1992)
|
|
26.08.2007 - 20:29
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 11 Регистрация: 26.08.2007 Из: Москва Пользователь №: 4301 |
В дикое докомпьютерное время, когда считать было тяжело, часто использовались приблизительные методы расчета оценок параметров. Один из вариантов - оценка среднеквадратичных отклонений и стат. погрешностей среднего по размаху (то есть разнице между максимальным и минимальным значениями) и т.п. Делать этого категорически нельзя - такие оценки справедливы только для нормально распределенных случайных величин. Для реальных:
а) Возможны сильные ошибки б) В этом случае нужно доказывать нормальность изучаемых распределений (что заведомо окажется неверным) |
|
27.08.2007 - 10:59
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Цитата(http://uborshizzza.livejou @ 26.08.2007 - 21:29) [snapback]3199[/snapback] В дикое докомпьютерное время, когда считать было тяжело, часто использовались приблизительные методы расчета оценок параметров. Один из вариантов - оценка среднеквадратичных отклонений и стат. погрешностей среднего по размаху (то есть разнице между максимальным и минимальным значениями) и т.п. Делать этого категорически нельзя - такие оценки справедливы только для нормально распределенных случайных величин. Для реальных: а) Возможны сильные ошибки б) В этом случае нужно доказывать нормальность изучаемых распределений (что заведомо окажется неверным) А почему распределение "заведомо" будет ненормальным? На основании анализа выборки? Так вот, самая частая ошибка - как раз определять нормальность распределения по малочисленной выборке... А вот определение стандартного отклонения по размаху очень даже разумный подход при планировании пилотных исследований, когда данных - даже выборочных - нет. Иного варианта просто не существует - надо определить количество пациентов для включения в исследование. Возможные колебания (размах данных) известен или предполагаем (размах, кстати, определить проще, чем SD). Скорее всего произойдет ошибка и оценка SD будет немного больше (если есть страх ненормальности - можно использовать неравенство Чебышева, тогда SD будет еще больше). Однако численность будет определена (количество пациентов будет большим, чем оптимальное, но все равно лучше, чем гадание на кофейной гуще). |
|
20.10.2007 - 20:55
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 11 Регистрация: 26.08.2007 Из: Москва Пользователь №: 4301 |
Отвечаю про ненормальность и нормальность распределений.
Дело в том, что по имеющейся выборке доказать нормальность наблюдаемой случайной величины нельзя в принципе. Можно сделать только обратное - доказать ненормальность. Поэтому в таких расчетах всегда будет использоваться предположение, про которое или доказано, что оно неверно, или недоказано, что оно верно. ОБРАЩЕНИЕ К МОДЕРАТОРУ _ ПОЧТИ OFFTOP_ Будет ли этично выложить указание на свою вышедшую книгу «Медицинская статистика». Если да, то куда это лучше сделать? Будет ли этично указать ссылку на свои материалы в блоге с практикумами по статобработке медицинских данных в Excel и SPSS. Если да, то куда это лучше сделать? |
|
21.10.2007 - 10:14
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Я думаю, давайте создадим ветку "В помощь пользователям - от авторов" и туда будем помещать информацию со ссылками на собственные творения, при этом читателям будет понятно, что это - в некоторой степени - рекламные материалы.
Насчет предположения о ненормальности как основного - не могу согласиться. Вы были бы правы, если бы существовало "ненормальное" распределение. на самом деле - это огромное количество очень разных распределений. Поэтому, отвергнув гипотезу о нормальности у Вас все равно проблема - какое распределение имеется в этих данных. Кроме того, проверяя нормальность распределения Вы все равно можете сделать ошибку. При этом, чем выше априорная вероятность нормального распределения данных (строго говоря - случайность разброса данных), тем выше эта вероятность этой ошибки. Мощность тестов для определения нормальности не очень высока, поэтому это - серьезная проблема - я уже приводил ранее результаты вычислительного эксперимента на эту тему. И последнее, по выборке нельзя доказать нормальность. Но и доказать не нормальность тоже нельзя. |
|
1.12.2007 - 17:06
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 32 Регистрация: 23.02.2007 Пользователь №: 3956 |
Спасибо за ответы, я уже нашла этот коэффициент
Туся
|
|