Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Кто знает специальный коэффициент для расчета стандартной ошибки средней?, средние величины
Ната
сообщение 6.06.2007 - 22:03
Сообщение #1





Группа: Пользователи
Сообщений: 32
Регистрация: 23.02.2007
Пользователь №: 3956



Люди, плиз, помогите! Без вас не справиться! Вышла вот какая "оказия": сотрудница "помогла чем смогла", подсунула таблицу на листе А4, сроком давности лет 300 (как я позже выяснила, но уже поздно...) Название таблицы таково "Коэффициенты Км для рассчета стандартной ошибки средней (М) по размаху рар.....вания" (здесь стерлась надпись и непонятно что за слово, на ранжирование не похоже). Приведены значения неизвестного мне коэфициента "К корень квадратный из n" в зависимости от числа наблюдений. Ошибка расситывается М макс-Ммин/ делить на этот коэффициент.

Теперь суть проблемы: я расчитала свой набранный материал по этой таблице, довольная такая... Потом думаю, дай проверю по книжным формулам, а результаты то отличаются (ошибки и сигмы)! Спросила у коллеги откуда она взяла таблицу, а она то и не помнит... frown.gif Что делать? Опять все пересчитывать заново, ой как жалко своих трудов! Я понимаю что вопрос "туповат", но может кто-нибудь что-то знает про эти коэффициенты?


Signature
Туся
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 6.06.2007 - 22:23
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



А не проще ввести свои данные в статистическую программу, где все и рассчитывать, тем более, что по судя по другим постам Вам все равно без моделей не обойтись frown.gif
Теперь к самому вопросу - можеть быть, слово там "варьирования". Попробуйте проверить так: возьмите большое N (например, 10000) затем посмотрите, чему равен этот Км если он равен 16,7 или около того (или для 100 наблюдений в диапазон 1,7 - 2,5), то идея здесь такова - минимальное и максимальное значения равны амплитуде значений. Амплитуда для большого числа наблюдений +/- 3 сигмы (+/-2 сигмы для малого числа наблюдений) соответственно сигма - амплитуда / 6 (или 4). Ошибка среднего равна сигма/корень(N), соответственно, для большого числа наблюдений K равно корень(N)/6.
Небольшой поиск с учетом Вашей специальности позволил найти книгу "Статистика в гигиенических исследованиях" (Медицина, 1965), где приводится метод экспресс-оценки средних величин концентрации по таблицам С.И.Ермолаева. Он действительно, построен на том принципе, что я подумал, сигма=ампл/К, где К=для 100 - 5,02, для 70 - 4,75, для 50 - 4,50 ошибка среднего рассчитывается путем деления полученной "сигмы" на квадратный корень из числа наблюдений.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 8.06.2007 - 10:23
Сообщение #3





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Не совсем понятно, что такое "Размах варьирования". Предложу версию, откуда всё это взялось.

Стандартная ошибка, как известно, вычисляется по формуле
m = s / sqr(n),
где s - стандартное отклонение,
sqr(.) - квадратный корень,
n - численность выборки.

Точечная оценка стандартного отклонения нормально распределенной совокупности может быть вычислена следующим способом
s = f / 2 F(0,75),
где f - межквартильный размах,
F(.) - функция, обратная функции стандартного нормального распределения.
Подставив значение F(0,75), получим
s = 0,741301f.

Нетрудно заметить, откуда мог взяться упомянутый коэффициент K и чему он равен.

В свою очередь, межквартильный размах равен
f = f3/4 - f1/4,
где f3/4 - значение верхней квартили выборки,
f1/4 - значение нижней квартили.

Напомним, что квартили, а также медиана (50% процентиль) обеспечивают разбиение упорядоченной количественной выборки (в виде вариационного ряда) на 4 подмножества равной численности. Практически вычисление квартилей производится по правилам, принятым для вычисления медианы.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 8.06.2007 - 20:02
Сообщение #4





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Все это здорово, только вот старые источники не очень жаловали межквартильные расстояния, а размах варьирования не что иное, как амплитуда (или просто размах) - обратите внимание, что в вопросе указано, что в формуле берется максимальное и минимальное значения. А так можно взять любое деление - почему надо делить на четыре части, а не на три? Можно воспользоваться терцилями (межтерцильное расстояние округленно равно s)? Или на пять - квинтилями? (s/2) Проблема, однако, в том, что для всех этих методов надо сортировать данные, а это, если у вас более 10 наблюдений уже неудобно. Найти максимум и минимум значительно проще, именно поэтому прикидочные методы оценки стандартного отклонения полагаются именно на них (например, когда надо быстро найти неизвестную сигму при планировании эксперимента, см. Knapp, Miller, 1992)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
http://uborshizz...
сообщение 26.08.2007 - 20:29
Сообщение #5





Группа: Пользователи
Сообщений: 11
Регистрация: 26.08.2007
Из: Москва
Пользователь №: 4301



В дикое докомпьютерное время, когда считать было тяжело, часто использовались приблизительные методы расчета оценок параметров. Один из вариантов - оценка среднеквадратичных отклонений и стат. погрешностей среднего по размаху (то есть разнице между максимальным и минимальным значениями) и т.п. Делать этого категорически нельзя - такие оценки справедливы только для нормально распределенных случайных величин. Для реальных:
а) Возможны сильные ошибки
б) В этом случае нужно доказывать нормальность изучаемых распределений (что заведомо окажется неверным)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 27.08.2007 - 10:59
Сообщение #6





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(http://uborshizzza.livejou @ 26.08.2007 - 21:29) [snapback]3199[/snapback]
В дикое докомпьютерное время, когда считать было тяжело, часто использовались приблизительные методы расчета оценок параметров. Один из вариантов - оценка среднеквадратичных отклонений и стат. погрешностей среднего по размаху (то есть разнице между максимальным и минимальным значениями) и т.п. Делать этого категорически нельзя - такие оценки справедливы только для нормально распределенных случайных величин. Для реальных:
а) Возможны сильные ошибки
б) В этом случае нужно доказывать нормальность изучаемых распределений (что заведомо окажется неверным)


А почему распределение "заведомо" будет ненормальным? На основании анализа выборки? Так вот, самая частая ошибка - как раз определять нормальность распределения по малочисленной выборке...
А вот определение стандартного отклонения по размаху очень даже разумный подход при планировании пилотных исследований, когда данных - даже выборочных - нет. Иного варианта просто не существует - надо определить количество пациентов для включения в исследование. Возможные колебания (размах данных) известен или предполагаем (размах, кстати, определить проще, чем SD). Скорее всего произойдет ошибка и оценка SD будет немного больше (если есть страх ненормальности - можно использовать неравенство Чебышева, тогда SD будет еще больше). Однако численность будет определена (количество пациентов будет большим, чем оптимальное, но все равно лучше, чем гадание на кофейной гуще).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
http://uborshizz...
сообщение 20.10.2007 - 20:55
Сообщение #7





Группа: Пользователи
Сообщений: 11
Регистрация: 26.08.2007
Из: Москва
Пользователь №: 4301



Отвечаю про ненормальность и нормальность распределений.

Дело в том, что по имеющейся выборке доказать нормальность наблюдаемой случайной величины нельзя в принципе. Можно сделать только обратное - доказать ненормальность.

Поэтому в таких расчетах всегда будет использоваться предположение, про которое или доказано, что оно неверно, или недоказано, что оно верно.


ОБРАЩЕНИЕ К МОДЕРАТОРУ _ ПОЧТИ OFFTOP_
Будет ли этично выложить указание на свою вышедшую книгу «Медицинская статистика». Если да, то куда это лучше сделать?

Будет ли этично указать ссылку на свои материалы в блоге с практикумами по статобработке медицинских данных в Excel и SPSS. Если да, то куда это лучше сделать?


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 21.10.2007 - 10:14
Сообщение #8





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Я думаю, давайте создадим ветку "В помощь пользователям - от авторов" и туда будем помещать информацию со ссылками на собственные творения, при этом читателям будет понятно, что это - в некоторой степени - рекламные материалы.
Насчет предположения о ненормальности как основного - не могу согласиться. Вы были бы правы, если бы существовало "ненормальное" распределение. на самом деле - это огромное количество очень разных распределений. Поэтому, отвергнув гипотезу о нормальности у Вас все равно проблема - какое распределение имеется в этих данных.
Кроме того, проверяя нормальность распределения Вы все равно можете сделать ошибку. При этом, чем выше априорная вероятность нормального распределения данных (строго говоря - случайность разброса данных), тем выше эта вероятность этой ошибки. Мощность тестов для определения нормальности не очень высока, поэтому это - серьезная проблема - я уже приводил ранее результаты вычислительного эксперимента на эту тему.
И последнее, по выборке нельзя доказать нормальность. Но и доказать не нормальность тоже нельзя.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Ната
сообщение 1.12.2007 - 17:06
Сообщение #9





Группа: Пользователи
Сообщений: 32
Регистрация: 23.02.2007
Пользователь №: 3956



Спасибо за ответы, я уже нашла этот коэффициент


Signature
Туся
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему