Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Двустороннее P-значение

Автор: Игорь 22.02.2008 - 19:52

Когда двустороннее P-значение статистики критерия равно удвоенному одностороннему, а когда нет?

Автор: плав 23.02.2008 - 22:22

Когда распределение статистики симметричное

Автор: Игорь 24.02.2008 - 11:32

Спасибо. Так и предполагал. Вопрос был вызван тем, что данный факт обходится вниманием в руководствах.

Если не сильно затруднит, можно привести примеры широко распространенных критериев (параметрических, непараметрических, согласия распределений), распределение статистики которых является симметричным и является несимметричным?

От себя приведу пример критерия с несимметричным распределением - точный метод Фишера, методики вычисления односторонних P-значений которого не удалось найти в литературе. Тем не менее многие программы данное вычисление производят.

Еще интересно, как влияет на результат (в смысле данной темы) "нормализация" статистики.

Если необходимо только двустороннее P-значение (которое является суммой односторонних), то различие односторонних значений не имеет значения. А вот если односторонние значения различны, то, очевидно, из вычисленного двустороннего значения "выудить" одностороннее в данном случае уже будет затруднительно.

Автор: плав 26.02.2008 - 10:47

На вскидку такие критерии (кроме Фишера, хи2 тоже асимметричный) мне в голову не приходят - поскольку остальные часто используемые критерии являются симметричными, как это видно из того, большинство при больших n имеют нормальную аппроксимацию.
Честно говоря, я никогда не понимал теоретического обоснования односторонних критериев (мы знаем, что х не может быть меньше у, но нулевая гипотеза, что х и у пришли из одного распределения - логическое противоречие), посему серьезно этим вопросом не занимался frown.gif

Автор: Игорь 26.02.2008 - 11:46

А вопрос-то интересный.

Пусть проверяется нулевая гипотеза "среднее одной выборки > среднего другой выборки". Обычно заведомо известно, что среднее действительно больше. Нужно показать, значимо ли. Гипотеза явно односторонняя. Получить должны, скажем, p = 0,049. На уровне 0,05 различие значимо. Однако авторы (и ПО) советуют применять всегда двусторонний тест. Т.е. мы сознательно огрубляем гипотезу до "среднее одной выборки не равно среднему другой выборки". И получить должны, по идее (для критерия с симметричной функцией распределения), p = 0,098. Т.е. на принятом уровне значимости 0,05 мы имеем недоказанность различий, хотя на самом деле, по логике, они имеют место.


Автор: плав 26.02.2008 - 12:45

Вот меня-то и смущает гипотеза "среднее популяции из которой пришла выборка 1 > среднего популяции из которой пришла выборка 2". Это больше напоминает альтернативную гипотезу (выборки из разных популяций), чем нулевую (выборки из одной популяции). Ведь почти все статистическое тестирование расчитано на то, что мы пытаемся ответить на вопрос "а могли ли получиться подобные различия, если бы мы брали выборки из одной популяции" и вот односторонний критерий добавляет, "мы учитываем при этом только положительные отклонения" (а почему не учитывать отрицательные?).
Соответственно, что среднее "действительно больше" известно только в рамках альтернативной, но никак не нулевой гипотезы, ибо в рамках нулевой средние равны. Соответственно, односторонний критерий просто игнорирует часть возможных (в рамках нулевой гипотезы) выборок. Почему - непонятно.
По опыту про односторонние критерии обычно вспоминают тогда, когда заветную границу в 0.05 перейти не удалось, а очень хочется smile.gif

Автор: Игорь 26.02.2008 - 14:50

smile.gif Согласен.

А, может быть, еще и авторы руководств не всегда имеют формулы (алгоритмы) расчета односторонних значений. Ведь проще сказать: "Советуем использовать двустороннее..." (см., например, у Флейса), чем дать все формулы и предоставить пользователю/читателю выбрать.

Автор: nokh 26.02.2008 - 19:39

Действительно в руководствах одно- или двусторонность критериев обсуждается в общем, без конкретики для разных критериев: односторонние вероятности умножать на 2 для двусторонних, двусторонние - делить если надо... Хотя где-то встречал, что удвоение односторонней вероятности дает консервативную оценку двусторонней. Более внимательно к этому относятся при оценке точных значений P, поэтому у меня сложилось впечатление, что простых формул для соответствующих расчетов нет, по крайней мере - для анализа таблиц частот, и настоящие одно- или двусторонние оценки P можно получить только перестановкой (permutation). В таком случае, принципиально важен тот факт, что аппроксимация распределения статистики как, например, более близким для конкретных данных асимметричным распределением, так и более далеким симметричным - все равно остается аппроксимацией. И односторонние оценки будут рассчитываться не для точного распределения, а для приближения. А потому, возможно, нет особого смысла мудрить с чуть более точными значениями P, можно и умножать/делить на 2. Т.е. в ряду: «точная оценка односторонней P --- оценка-аппроксимация односторонней P --- оценка-аппроксимация, полученная делением двусторонней P» центральное звено является промежуточным между точным но ресурсоемким и неточным но быстрым. Нужно ли это звено практику? А что касается принципиальной возможности использования односторонних критериев - это уже скорее из области философии науки, и нужно ли всем ученым быть жесткими минимаксерами smile.gif ?

Автор: Игорь 27.02.2008 - 07:27

Я не думаю, что вопрос закрыт.

Чтобы выяснить, что же все-таки мы считаем, обратимся к руководствам и ПО.
Введем 2 выборки в Excel
1 выборка: 1 3 2 3 1 1 2
2 выборка: 4 5 3 4 5 6 4

Посчитаем с помощью "Пакета анализа" Excel критерий Стьюдента. Получаем (как и следовало ожидать)
одностороннее P = 0,0001254896...
двустороннее P = 0,0002509792...

Теперь подставим те же исходные данные в формулу расчета критерия Стьюдента. Получаем (как не ожидалось)
P = 0,9998745...

Согласно Тюрину с соавт., значимыми признаются и малые, и большие значения статистики, поэтому, видимо, справедлива формула
p-значение = Min(P, 1 - P)

Подставляем. Получаем
P = 0,0001254896...

Итак, стандартная общеупотребительная формула все-таки считает ОДНОСТОРОННЕЕ значение. Хотя читателям об этом обычно не сообщается.
Те же самые рассуждения, примеры и выводы (за исключением чисел, естественно) относятся и к F-критерию.

Далее, еще пара примеров. Стандартный хи-квадрат критерий для дихотомических выборок считает двустороннее значение. Не менее стандартный z-критерий считает одностороннее.

Что считает критерий Вилкоксона, в рассматриваемом смысле, не совсем понятно, т.к., кроме Excel, никакими программами анализа данных не обладаю, поэтому был бы благодарен счастливым обладателям больших программ за прояснение ситуации.

Автор: nokh 27.02.2008 - 21:41

Про общеупотребительную формулу, считающую одностороннюю вероятность не понятно. Возможно потому что не считаю в Excel'е статистику - не знаю что там за формулы. Для t-критерия должны выдаваться только степень свободы и значение t - оно ведь будет одинаковым независимо от одно-двусторонности. А одно- или двусторонняя P считается далее по этому t...?
Приведенные данные примера не очень удобны чтобы разбираться, лучше бы иметь значение P в диапазоне, который более-менее подробно табулирован в руководствах. Менее 0,001 - очень мало.
Из бесплатных пакетов очень рекомендую попробовать KyPlot. Она есть в списке бесплатных программ, который вы здесь раньше выкладывали. Прямая ссылка:
http://freestatistics.altervista.org/kyp2b15.zip
Все никак не собирусь написать про те программки из списка, которые пробовал. А KyPlot'ом пользуюсь лет 5 - гениальная вещь. Проверял расчеты по таблицам сопряженности, непараметрику, пару вариантов факторного анализа - сходится с другими пакетами или ручными расчетами. Безграничные возможности создания сложной научной графики - готовлю в ней рисунки для публикаций. Там есть и t-критерий и критерий Вилкоксона (к сожалению асимптотика), все промежуточные расчеты подшиваются - видно как что делалось. Программа понимает файлы экселя напрямую - можете использовать уже готовые примеры.

Автор: Игорь 28.02.2008 - 09:52

Цитата(nokh @ 27.02.2008 - 21:41) *
Про общеупотребительную формулу, считающую одностороннюю вероятность не понятно.

При чем тут "общеупотребительная формула, считающую одностороннюю вероятность"? Никто о ней не говорил.

Формула для критерия:
t = |m1 - m2| / s / sqrt(1 / n1 + 1 / n2),
где m1 и m2 - средние совокупностей,
s - оценка выборочной дисперсии,
n1 и n2 - численности совокупностей.
Квадрат s считается как
s2 = (s12(n1 - 1) + s22(n2 - 1)) / (n1 + n2 - 2),
где s12 и s22 - оценки выборочных дисперсий.
По таблицам для вычисленного t и для (n1 + n2 - 2) степеней свободы можно найти p-значение. Можно его посчитать и как корень уравнения через обратную функцию t-распределения (кто умеет - не суть важно).

Прошу прощения, обозначения кривы из-за невозможности ввода формул в форуме.
Цитата(nokh @ 27.02.2008 - 21:41) *
Возможно потому что не считаю в Excel'е статистику - не знаю что там за формулы. Для t-критерия должны выдаваться только степень свободы и значение t - оно ведь будет одинаковым независимо от одно-двусторонности. А одно- или двусторонняя P считается далее по этому t...?

Excel тут не при чем. Использован только в качестве доступного средства анализа данных, данный тест считающий правильно, а потому годный для сравнительного анализа.
Цитата(nokh @ 27.02.2008 - 21:41) *
Приведенные данные примера не очень удобны чтобы разбираться, лучше бы иметь значение P в диапазоне, который более-менее подробно табулирован в руководствах. Менее 0,001 - очень мало.

Данные примера нужны лишь для того, чтобы подставить их в формулу и посмотреть результат. Без его трактовки. Только цифры. Для сравнения. Большие - малые - не имеет значения. Обсуждается проблема, что именно считает формула, а не значимость теста.
Цитата(nokh @ 27.02.2008 - 21:41) *
Из бесплатных пакетов очень рекомендую попробовать KyPlot. Она есть в списке бесплатных программ, который вы здесь раньше выкладывали. Прямая ссылка:
http://freestatistics.altervista.org/kyp2b15.zip

Данной программы нет в упомянутом списке, и слышу о ней впервые. Но спасибо.
К сожалению, ссылка битая. Но бета-версию упомянутой программы можно найти в Интернете. Например, тут http://woundedmoon.org/win32/kyp2b15.exe.
А вот что к великому сожалению, программа KyPlot перестала быть бесплатной. Ссылка http://www.kyenslab.com/en/index.html.

Автор: плав 28.02.2008 - 13:33

Цитата(Игорь @ 27.02.2008 - 07:27) *
Я не думаю, что вопрос закрыт.

Чтобы выяснить, что же все-таки мы считаем, обратимся к руководствам и ПО.
Введем 2 выборки в Excel
1 выборка: 1 3 2 3 1 1 2
2 выборка: 4 5 3 4 5 6 4

Посчитаем с помощью "Пакета анализа" Excel критерий Стьюдента. Получаем (как и следовало ожидать)
одностороннее P = 0,0001254896...
двустороннее P = 0,0002509792...

Теперь подставим те же исходные данные в формулу расчета критерия Стьюдента. Получаем (как не ожидалось)
P = 0,9998745...

Согласно Тюрину с соавт., значимыми признаются и малые, и большие значения статистики, поэтому, видимо, справедлива формула
p-значение = Min(P, 1 - P)

Подставляем. Получаем
P = 0,0001254896...

Итак, стандартная общеупотребительная формула все-таки считает ОДНОСТОРОННЕЕ значение.

Рассуждения не совсем понятны. Формула (любая) для рассчета t-критерия расситывает его, а затем определяет вероятности превышения этого значения t по модулю. Т.е. если рассчитать t по этим выборкам и затем на их основе р, то получите 0,9998745 и 0,0001254896. Просто Вы автоматом запросили одностороннее значение, пытаясь выяснить, какое значение р соответствует данному t, но не учли, что ввиду симметричности будет еще определенная вероятность появления значений меньших (-t). Так что формула не считает односторонний критерий, она считает тот, который был задан. В случае распределения Стьюдента р двухстороннее будет точно равно 2*р одностороннее.
В случае несимметричных распределений вероятность значений меньших или равных (-k) (где к - изучемая статистика) будет иной, чем больших или равных к, поэтому двусторонний критерий и не будет удвоенным односторонним.
На самом деле все вопросы достаточно быстро решаются для нужного критерия вычислительным экспериментом...

Автор: nokh 10.03.2008 - 09:08

Цитата(Игорь @ 28.02.2008 - 11:52) *
Данные примера нужны лишь для того, чтобы подставить их в формулу и посмотреть результат. Без его трактовки. Только цифры. Для сравнения. Большие - малые - не имеет значения. Обсуждается проблема, что именно считает формула, а не значимость теста.

Статистические таблицы в хороших руководствах точнее чем результаты кривоватых программ. В особенности это справедливо для значений на концах распределений. Известно, что Exсel не является статистическим пакетом, и не принимается в качестве такового по крайней мере некоторыми профессиональными статистиками (быстро ссылку не найду). Неточность статистических функций в Excel'е поднималась на этом форуме, правда давно, в "прошлой жизни" сайта. В интернете про это можно немало найти, хороший обзор проблем здесь: http://www.practicalstats.com/xlsstats/excelstats.html . Есть и другие пакеты, доверие к которым было когда-то и чем-то подорвано. Например, обнаружением в известном пакете кусков кода статистических алгоритмов из продукта SYSTAT.
Поэтому чтобы разбираться со значениями P лучше иметь и программы и хорошие статистические таблицы. В статистических таблицах наиболее полно табулирован интервал значений, сопровождающий принятие решения. Где-то от 0,15 до 0,01.
Значение P=0,0001254896 из примера (1) находится на конце распределения, а здесь экселю (и другим потенциально кривоватым программам) нет доверия и (2) если я захочу найти это значение P в хорошей статистической таблице, то не смогу этого сделать, уж больно оно маленькое. Именно это я хотел сказать фразой, что "приведенные данные примера не очень удобны чтобы разбираться".

Обсуждение программы KyPlot вынесу в имеющуюся более подходящую ветку.

Автор: Игорь 10.03.2008 - 10:22

Цитата(nokh @ 10.03.2008 - 09:08) *
В интернете про это можно немало найти, хороший обзор проблем здесь: http://www.practicalstats.com/xlsstats/excelstats.html .

Вот-вот. Спасибо, nokh! Именно так. Нельзя указывать p-значение, не отметив, к какой гипотезе это относится (одно- или двухсторонней). Тем более заставлять пользователя программы или читателя руководства заниматься вычислительным экспериментом, чтобы выяснить, что же все-таки считает программа/формула. И уж тем более в рамках одного пакета или руководства указывать и односторонние, и двухсторонние значения без комментариев.

Считаю, что было бы полезно обсудить правильность и точность вычислений программ, в том числе Excel. Но это - отдельная тема. У меня есть подборка материалов на эту тему.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)