Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Статистическая достоверность, формула для расчёта p
VC696
сообщение 26.04.2007 - 23:19
Сообщение #1





Группа: Пользователи
Сообщений: 1
Регистрация: 26.04.2007
Пользователь №: 4067



Здравствуйте!
Подскажите, пожалуйста, формулу для расчёта p. Спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 1.05.2007 - 11:12
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



В какой ситуации? Одной формулы не существует. Обычно расчитывается вспомогательная статистика (t, z, F, U) и на ее основе рассчитывается р (как интеграл распределения от расчетного значения статистики до бесконечности) smile.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 2.05.2007 - 17:13
Сообщение #3





Группа: Пользователи
Сообщений: 1141
Регистрация: 10.04.2007
Пользователь №: 4040



Видимо, имеется в виду показатель точности опыта, иначе - показатель точности определения среднего значения. Он выражает величину ошибки среднего значения в процентах от самого среднего. Точность считается удовлетворительной, если величина показателя не превышает 5%, а при значениях, больших 5%, рекомендуется увеличить число наблюдений или повторений. Иногда величину показателя точности можно уменьшить, если повысить точность измерений. Показатель точности опыта вычисляется по формуле:
p = m / x в долях или P = m / x * 100 в процентах,
где m - стандартная ошибка,
x - выборочное среднее значение,
Очевидно, показатель точности определения среднего значения - это именно то, что имеют в виду, указывая в публикациях после M +- m через запятую, к примеру, выражение p < 0,05, называя его достоверностью. Хотя это определение в данном случае не совсем верно, но оно используется традиционно.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 9.05.2007 - 12:04
Сообщение #4





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Ну вообще-то то о чем говорит Игорь называется коэффициентом вариации и обозначается CV, если он описался и назвал стандартное отклонение стандартной ошибкой. Если он не описался, то такой показатель бессмысленнен (представьте себе шкалу значений, которые могут меняться от -100 до +100, стандартная ошибка в первом и во втором экспериментах 10. Однако в первом эксперименте среднее 10, во втором 100. Следуя описанной выше логике точность в первом эксперименте 100%, во втором - 10%, хотя на самом деле оба эксперимента одинаково "точны").
р - не имеет никакого отношения к CV. р-оценка, предложенная Р.Фишером (которая и обозначается буквой р, коэффициент вариации НИКОГДА не обозначался так) - вероятность нахождения значений равных или больших данному в случае случайной выборки из популяции. Для нормального распределения она равна интегралу от найденной величины до плюс (минус) бесконечности exp(-z^2/2) (если нормальное распределение стандартизовано (0,1)). Иными словами считать вручную не совсем удобно (хотя можно на почти всех научных калькуляторах). р является не показателем точности измерений, а показателем вероятности того, что данное наблюдение (выборка) были получены из данной популяции. Показателем точности иногда называют половину ширины доверительного интервала (1,96*m), однако в данном случае формула расчета m выглядит так: \frac{\sigma}{\sqrt{N}}, где \sigma - стандартное отклонение, N - количество наблюдений. формула \sigma зависит от типа распределения, для нормального это \sqrt{\frac{\SUM{x-x^2}}{N-1}}. В примере выше точность будет одинаковой в обеих случаях (19,6 единиц). Но для получения р необходим еще один показатель - популяционное среднее, и именно поэтому показатели точности приниципиально отличаются от показателей тестирования статистических гипотез (типа р-оценки). Одни указывают на качество ихмерительного инструмента (CV, ширина доверительного интервала), другие - на принадлежность выборки к определенной популяции
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 10.05.2007 - 08:52
Сообщение #5





Группа: Пользователи
Сообщений: 1141
Регистрация: 10.04.2007
Пользователь №: 4040



Все это интересно и очень грамотно, но немного в сторону от темы. Обсуждался иной показатель. Поэтому продолжим.
Показатель точности обозначают как P, p [Зайцев] или Cs [Лакин]. Он связан с коэффициентом вариации Cv простой формулой
Cs = Cv / sqr (n),
где n - численность выборки,
sqr(.) - квадратный корень.
В показанной формуле Cv и Cs - в процентах.
Определение и примеры применения показателя точности см. в [Зайцев, с. 37], [Лакин, с. 105]. Последний источник встречается в недрах Интернета в электронном виде. Его поиск не должен вызвать затруднения.
Да, может вызвать затруднение расчет стандартной ошибки, судя по предыдущему сообщению. Она считается по формуле
m = s / sqr(n),
где s - выборочное стандартное отклонение (обозначаться может и как "сигма").
Стандартная ошибка может обозначаться также по-разному - например, как "мю".
Чтобы не путаться в обозначениях, применяется простой прием: в работе дается расшифровка всех используемых математических обозначений.

Литература.
1. Зайцев Г.Н. Математическая статистика в экспериментальной ботанике. ? М.: Наука, 1984.
2. Лакин Г.Ф. Биометрия. ? М.: Высшая школа, 1990.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 10.05.2007 - 11:46
Сообщение #6





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Во-первых непонятно, почему в сторону от темы? Человек спрашивал про формулу для р? Почему это формула должна быть для р как показателя точности в интерпретации Г.Н.Зайцева (попробуйте поискать в литературе - я имею ввиду в статьях, рецензируемых журналах, такое обозначение показателя точности и сравните с использованием р в качестве показателя справедливости нулевой гипотезы)?
Вообще по поводу использования "показателя точности" вместо статистической достоверности, см. http://www.biometrica.tomsk.ru/lis/index19.htm

Теперь, что касается показателя точности в его правильногй интерпретации. Еще раз повторюсь - идет путаница контроля качества (где используется CV и может использоваться показатель точности) и тестирования статистических гипотез. В случае контроля качества CV вполне законный показатель, демонстрирующий надежность измерения. В этом случае речь идет о том, насколько данные варьируют вокруг среднего (предполагается, что и среднее и дисперсия равны популяционным). Иными словами - это показатель дисперсии.
Во всех других случаях этот показатель смысла не имеет, поскольку выборочное среднее может быть не равно популяционному и, соответственоо, показатель будет прыгать от одной выборки к другой (даже в теории).

Кстати, ГОСТ 20182-74 ""Конструкции асбестоцементные клееные. Метод определения прочности клеевых соединений при сдвиге"
(введен в действие постановлением Госстроя СССР от 30 августа 1974 г. N 190)" (ну раз уж цитируем источники более 20-летней давности) дает другое определение "показателя точности" - 2/M (в процентах) (http://www.yondi.ru/inner_c_article_id_1217.phtm). Так что найти эзотерическое определение показателей - дело не сложное...

Во-вторых по поводу обозначений - согласен, надо расшифровывать. Но все-таки есть определенные правила. Правило первое - популяционные показатели обозначаются греческими буквами, выборочные - латинскими. Иными словами, когда пишется s - речь идет о выборочном стандартном отклонении, сигма - популяционное стандартное отклонение. m не может обозначаться мю, поскольку m - стандартная ошибка выборочного среднего определена только для выборки. мю - популяционное среднее (M - выборочное среднее). Более-менее стандратный набор показателей и их названия можно найти в Википедии (http://en.wikipedia.org/wiki/Category:Statistical_deviation_and_dispersion).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ВалНест
сообщение 1.06.2008 - 09:50
Сообщение #7





Группа: Пользователи
Сообщений: 13
Регистрация: 1.06.2008
Пользователь №: 5074



Он выражает величину ошибки среднего значения в процентах от самого среднего.
Я хотел несколько уточнить терминологию. Как правильно писать "величину ошибки..." или "значение ошибки ...". "Ошибка ..." разве не является статистической величиной, показателем?

выражение p < 0,05, называя его достоверностью.
Может быть лучше говорить не о "достоверности", а о "статистической значимости"?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему