Добрый день! Подскажите, пожалуйста, кто знает, как определить насколько стандартная ошибка среднего велика? У меня есть результаты исследований с рассчитанными средними и ошибками, но эти данные не подлежат сравнению на достоверность (если можно так выразиться). Как я понимаю, ошибку можно уменьшить набрав большее количество исходных данных, как мне узнать что ошибка велика, т.е. нужно увеличить количество данных, а может, и не нужно? Заранее большое спасибо.
В вашем вопросе можно выделить целых 3, а потому лучше его сузить.
Вопрос 1 - о допустимой величине стандартной ошибки среднего - достаточно общий и допускает различные ответы в зависимости от контекста (точность оценки среднего, пластичность показателя, отличие распределения показателя от нормального и т.д.).
Вопрос 2 - о сравнении между собой данных, представленных только уже рассчитанными средними и их стандартными ошибками, в отсутствие оригинальных данных. Такие данные подлежат сравнению t-критерием Стьюдента, если вдобавок к среднему и ошибке известны объемы выборок, а также если допустить нормальное распределение показателя.
Вопрос 3 - о планировании объема выборки, необходимой для установления статистически значимых различий средних, на основе уже имеющихся ориентировочных оценок средних и ст. ошибок.
Опишите подробнее что вам нужно, есть ли исходные данные, сколько выборок нужно сравнить?
Спасибо за ответ. Дело в том, что у меня достаточно специфическая тема, речь идет не о выборке пациентов, а о некотрых величинах (дозы вещества), которые я рассчитала, мне не нужно их ни с чем сравнивать, если я например, получила следующее значение :13,47?5,23-как мне узнать, не велика ли ошибка 5,23?
Ясно, речь идет о точности оценки среднего. Мне представляется, что если Ваша работа - обычное исследование, то можно просто ограничиться указанием полученных оценок среднего и его ст. ошибки. Если же работа предполагает дальнейшее использование Ваших оценок доз, то следует руководствоваться имеющимися стандартами точности измерений, которые используются в вашей области исследований. Обычно это ГОСТы, а точность оценки среднего характеризуется величиной погрешности измерений, которая не должна превышать установленного ГОСТом значения. Чтобы расчитать погрешность надо стандартную ошибку умножить на нужное значение t-критерия - см., например:
http://www.students.chemport.ru/materials/deviations.htm. Но сталкивался с другими подходами. Например, согласно методике поверки прибора, за которым приходится иногда работать, он считается годным для анализа, если величина среднеквадратического отклонения не превышает 5% от величины среднего значения, полученного по результатам 10-кратного измерения определенного методикой образца (т.е. регламентируется не погрешность, а величина коэффициента вариации). Глубже в вашем вопросе не разбираюсь, подождем других ответов и мнений.
DrgLena
23.07.2008 - 10:23
Задача, скорее не на точность измерения, а на оценку разброса данных (тогда лучше привести SD), поскольку выборка данных получена расчетным путем, т.е дозы получаются , возможно, с учетом массы тела, возраста и т.д. Каждый пациент получил определенную дозу и их решили усреднить и как это у нас обычно принято, привести с ошибкой среднего. В таком случае нельзя сказать большая она или не большая - это просто объективная характеристика выборки.
Цитата(Ната @ 22.07.2008 - 18:46)

Добрый день! Подскажите, пожалуйста, кто знает, как определить насколько стандартная ошибка среднего велика? У меня есть результаты исследований с рассчитанными средними и ошибками, но эти данные не подлежат сравнению на достоверность (если можно так выразиться). Как я понимаю, ошибку можно уменьшить набрав большее количество исходных данных, как мне узнать что ошибка велика, т.е. нужно увеличить количество данных, а может, и не нужно? Заранее большое спасибо.
Насколько понял, автора поста интересует, как определить, велика ли ошибка среднего значения относительно самого среднего.
Для этого применяют показатель точности опыта, иначе - показатель точности определения среднего значения, который выражает величину ошибки среднего значения в процентах от самого среднего. Показатель точности опыта вычисляется по формуле:
P = Стандартная Ошибка / Выборочное Среднее в долях или
P = Стандартная Ошибка / Выборочное Среднее * 100% в процентах.
Точность считается удовлетворительной, если величина данного показателя не превышает 5%, а при значениях, больших 5%, рекомендуется увеличить число наблюдений или повторений. Иногда величину показателя точности можно уменьшить, если повысить точность измерений параметров объектов опыта.
Спасибо за ответы, это полезная информация.
inview
30.07.2008 - 07:06
Не совсем понятно, почему уважаемый Игорь так жестко утверждает о удовлетворительной точности 5%, и неудовлетворительной, скажем, для 5,1%. Все в существенной мере зависит от постановки задачи. Как справедливо было подмечено, одно дело - точность анализа, другое - некий экспериментальный феномен - в этом случае понятие "достаточной" точности вообще теряет большую часть своего обычного смысла. Но если говорить и о точности анализа, то даже посмотрев на такую нормированную вещь, как требования к точности результатов клинических анализов, то и там можно встретить величины требуемого коэффициента вариации (это собственно и есть
Цитата
Стандартная Ошибка / Выборочное Среднее * 100% в процентах
) и в 3%, и в 15%.
Если же в данном случае речь идет о (новом) методе анализа, то утверждение о "достаточности" его точности должно браться не от умозрительных величин, а из сравнения с референтным методом ("золотым стандартом") или - в зависимости от задачи - с общеупотребимым для данных целей методом.
Цитата(inview @ 30.07.2008 - 07:06)

Не совсем понятно, почему уважаемый Игорь так жестко утверждает...
5% - одно из стандартных значений. 10% - вроде бы совсем грубо. 1% - слишком жестко. Потому и 5%. Принято для разведочных исследований. Есть ссылки на источники.
Интересно, откуда взялись такие пороговые значения? Поясняю - выбраны совершенно произвольно. Надо же было что-то выбрать. К тому же раньше статистические таблицы считали почти что вручную, поэтому нужны были какие-то пороговые значения. Вот и выбрали. Хочется 5.1%? да ради бога. Последнее время в программах вообще от всяческих пороговых значений и вероятностей отказались - берутся вычисленные (достигаемые).
Как-то в начале 60-х годов наш профессор на практическом занятии спросил аудиторию, зачем нужен такой-то метод (помнится, это было уравнение Рауса из аналитической механики). Студенты, естественно, начали выдвигать гипотезы о его преимуществах перед уравнением Лагранжа для решения задачи движения при тех или иных условиях и т.п. Профессор внимательно выслушал, засмеялся, говорит: "Да нет, не для этого. Просто нужно было вам что-то прочитать в отведенные часы цикла, вот я и прочитал вам эту тему".
Где-то лет 50 назад читал (сейчас не помню уже - давно было), что есть легенда (а может, это и правда), как именно выбирались значения. Пирсон и Фишер опубликовали каждый свои таблицы. Чтобы авторские права не пересеклись, и были выбраны тем и другим различные значения. Когда собрали все в кучу - получили то, что имеем.
inview
30.07.2008 - 17:41
Вот-вот, об условности и речь. Да и я не зря упомянул о типе задачи. Если задача аналитическая (опять же в качестве примера) - то смысл "достаточной" точности состоит не в какой-то цифре, а в том, что желательная точность нового метода должна быть выше, чем у существующего. Если же речь об оценке биологической вариабельности, то позвольте и я своего МГУ-шного профессора вспомню, которые регулярно нам напоминал, что, работая с живыми организмами, "не надо пугаться ни 25%, ни даже 50%-разбросов, а вот если вы скажете, что у вас вариабельность была 5% - я Вам никогда не поверю и буду искать, где Вы ошиблись". Феномен, он и есть феномен, а уж чего мы от него ждали - это наша проблема, а не природы.
P.S. Кстати, если уж на то пошло, то и объем выборки следует планировать ДО, а не потом. В тех же качественных и доказательных РКИ только так и поступают, исходя из априорной оценки эффекта, который хотели бы обнаружить.
Добавлю еще, что если хочется брать другие пограничные значения коэффициента вариации, то надо помнить, что он характеризует обычно качество измерительного прибора. А все статистические методы построены на том, что измерения являются точными (т.е. существует допущение, что ошибка измерения не сопоставима по величине с самим значением). Соответственно, если CV=10%, то измерения варьируют очень сильно (стандартная ошибка составляет 10% от значения, а, соответственно, диапазон случайных колебаний составляет (в 95% случаев) 40% от измеренной величины (+/-2*10%)). Для того, чтобы ошибка "не была сопоставима" она считается должна быть меньше как минимум на порядок, соответственно, диапазон +/-10% (т.е. CV=5%) является минимальным, который даст ошибку на порядок меньшую, чем само значение. Однако возможный диапазон (ширина доверительного интервала) все равно будет 20%. Поэтому в реальности CV должно быть значительно меньше 5%, лучше всего менее 2.5%. (тогда ширина ДИ для колебаний, вызванных ошибкой измерения составит 10%).
Для просмотра полной версии этой страницы, пожалуйста,
пройдите по ссылке.