Цитата(DrgLena @ 8.06.2008 - 01:06)

С Манном-Уитни разобрались, но не совсем, хотя Игорь хотел разобраться с Уилкоксоном. А возвращаясь к М-У, если интересно, то программа MedCalc дает такой результат:
1 пример Two-tailed probability P = 0,0317
2 пример Two-tailed probability P = 0,0082
Господа хорошие!
Имя Уилкоксона несут два критерия (теста, процедуры проверки статистических гипотез):
двухвыборочный - ранговый - для сравнения двух независимых выборок из непрерывных распределений. Это аналог двухвыборочного t-критерия Стьюдента.
одновыборочный, он же рангово-знаковый - для сравнения парных (сопряженных) наблюдений. Это аналог парного (одновыборочного) t-критерия Стьюдента.
В обоих случаях статистикой критерия является сумма рангов. В одновыборочном ранжируются разности парных наблюдений, и подсчитывается сумма рангов для разностей одного знака - положительных или отрицательных.
В двухвыборочном критерии ранжируются значения обеих выборок, и подсчитывается сумма рангов, полученных одной из выборок. Предельный случай - когда значения выборок не перекрываются. Тогда сумма рангов для выборки (объемом m) с меньшими значениями будет суммой натуральных чисел от 1 до m, а для второй выборки (объемом n) - сумма чисел от m+1 до m+n.
Что сделали Манн и Уитни? Они подметили, что статистика суммы рангов эквивалентна статистике, названной их именами. Поэтому, отдавая дань всем создателем, критерий часто называют критерием Уилкоксона-Манна-Уитни.
Алгоритм вычисления конкретных значений статистики Манна-Уитни лучше всего изложен в нашем учебнике (Глотов Н.В., Животовский Л.А., Хованов Н.В., Хромов-Борисов Н.Н. Биометрия. Л.: ЛГУ, 1982. - 263 с.). Отбрасывая ложную скромность, могу признаться, что придумал этот алгоритм я. Но вскорости в Biometrical Journal появилась статья, в которой этот алгоритм был изложен в виде текста программы.
Строим таблицу (матрицу попарных сравнений) размером mn (m - объем первой выбоки, а n - объем второй выборки), в левом столбце которой выписываем значения первой выборки, а в верхней строчке - значения второй выборки. Для наглядности эти значения лучше упорядочить. Каждое левое значение мы сравниваем с каждым значением наверху. Если левое значение больше, мы ставим в соответствующую ячейку 1, если меньше, то 0.
Для первого примера Игоря:
Код
Значения: 11.9853 11.9885 11.9949 12.0061
12.0016 1 1 1 0
12.0054 1 1 1 0
12.0064 1 1 1 1
12.0067 1 1 1 1
12.0077 1 1 1 1
(У меня сначала не получилось растянуть пробелы между нулями и единицами, sorry. Теперь - спасибо LogVin - научил(а), что делать)
Сумма единиц в такой матрице и есть наблюдаемое значение статистики Манна-Уитни. В данном случае U=18.
Иными словами, в статистике Манна-Уитни подсчитывают, сколько раз значения в первой выборке превышают значения во второй при их попарном сравнении.
В качестве проверки правильности полезно знать, что сумма единиц U и нулей U' равна произведению объемов выборок: U+u'=18+2=4x5=20=mn. Очевидно, что если поменять строки и столбцы местами (или, что то же самое - обозначать единицами случаи, когда значение слева меньше верхних значений), то значение U'=mn-U=2. Понятно, что крайними вариантами будут матрицы, сплошь содержащие одни нули или одни единицы. Всего возможно (m+n)!/(m!n!) равновероятных комбинаций нулей и единиц в такой матрице.
Удивительно, что для распределения статистики Манна-Уитни нет простой формулы, по которой можно было бы вычислять «плотность» и (или) функцию распределения этой статистики. Ее можно находить только с помощью рекуррентного соотношения, которое и вывели Манн с Уитни. Его можно найти в их статье или у Оуэна Д.Б. в его великолепном переведенном у нас Сборнике статистических таблиц. М.: ВЦ АН СССР, 1966 (2-е изд. - 1973). - 586 с.
Для первого примера Игоря такие вычисления дают одностороннее Р=0,031746, которое, естественно, совпадает с тем, какое выдают StatXact или StatsDirect.
Во втором примере Игоря имеется одно «совпадение» (значение 95.6 встречается в обеих выборках); в таком случае в ячейку ставится значение 1/2. Для этого второго примера U=2.5. В идеале (по теории) таких значений не должно быть, поскольку одно из основных условий применения критерия Уилкоксона (основанного как на статистике Уилкоксона, так и на статистике Манна-Уитни) является непрерывность распределений, из которых извлечены выборки. В таких распределениях вероятность совпадений равна нулю. На практике, как мы видим, совпадения встречаются. Для этого в асимптотические формулы вводятся поправки на совпадения. Если совпадений «немного», то они мало влияют на получаемые Р-значения. Надо однако помнить, что при наличии совпадений критерий перестает быть свободным от распределения (непараметрическим): он становится зависимым от неизвестного распределения для совпадений.
Что же сравнивают статистики Уилкоксона и Манна-Уитни, мерой различия чего они являются?
Они проверяют гипотезы о том, являются ли случайные величины X и Y СТОХАСТИЧЕСКИ равными (нулевая гипотеза Но: X=Y), или стохастичекси неравными (альтернативная гипотеза Н1). Поскольку заранее у нас нет никаких соображений об альтернативе (об ее направлении: либо X>Y, либо X<Y), то альтернатива у нас всегда двухсторонняя. Когда ФОРМА двух изучаемых распределений одинакова, то такое сравнение сводится к гипотезам о равенстве медиан Ходжеса-Лемана у этих распределений. Говорить, как это нередко делается, что критерий Уилкоксона проверяет равенство медиан (а тем более, средних) - некорректно. Я предлагаю называть такие медианы «ходжлеманами».
Если же сравниваемые распределения различаются по форме, например, если у них разные параметры рассеяния, то в таком случае встает та же проблема (называемая проблемой Беренса-Фишера), что и при использовании t-критерия. Об этом есть статья, написанная специально для медиков. Hart A. Mann-Whitney test is not just a test of medians: differences in spread can be important. BMJ 2001;323;391-393. При различии дисперсий t-критерий должен это учитывать, и одним из рациональных решений является замена t-критерия критерием Уелча. Для критерия, основанного на статистиках Уилкоксона или Манна-Уитни, также имеются соответствующие модификации.
То, что этот критерий является аналогом t-критерия Стьюдента, легко понять, если представить числитель статистики t-критерий (каковым является разность средних двух независимых выборок) как среднее из всех возможных попарных разностей значений из первой выборки и из второй выборки: M1-M2=[(x11-x21)+(x12-x22)+?+(x1m-x2n)]/(mn). См. наш учебник.
Давно известно, что вместо или наряду с Р-значением настоятельно рекомендуется представлять результаты проверки статистических гипотез в виде доверительных интервалов (ДИ) для разности сравниваемых распределений или их параметров (для параметра сдвига). Так вот, «вывернув наизнанку» статистики обсуждаемых критериев, можно построить непараметрические ДИ для ходжлеманы для параметра сдвига S (для разности ходжлеман).
Для обсуждаемого примера StatXact дает точечную оценку для такой ходжлеманы: S(HL)=0,00895 и точный 95%-й ДИ для нее: от -0,0007 до 0,0219. Поскольку объемы выборок слишком малы, то точный 99%-й ДИ не существует (вернее, он простирается от +00 до -00 (бесконечности). Идентичный результат выдает StatsDirect, только в ней фиксировано лишь одно значение для доверительной вероятности - 95%.
В модуле Nonparametrics/Two Independed Samples/Hodges-Lehmann Estimates of Shift Parameter она выдает абсурдный асимптотический 99%-й ДИ: от 0,0224 до 0,0224. Уж не ошибка ли это?
Отсюда вытекает явная польза статистик Уилкоксона или Манна-Уитни при элементарном планировании эксперимента. Они могут подсказать, какие требуются минимальные объемы выборок, чтобы можно было сделать более или менее вразумительные статистические выводы. Например, для построения (небесконечных) 99,9%-х ДИ надо, чтобы объемы обеих выборок были бы не менее 11. Это, если объемы выборок равны. Для выборок неравных объемов суммарные цифры будут больше. Например, можно иметь в одной выборке всего одно наблюдение (m=1), но для построения 99,9%-го ДИ для параметра сдвига объем второй выборки должен быть не меньше n=1999 !
Проверка гипотез с помощью ДИ для параметра сдвига становится наглядной. Согласно Но параметр сдвига S=0, а при альтернативе S не равно 0. В данном примере 95%-й ДИ для параметра сдвига S накрывает значение 0, постулируемое нулевой гипотезой. Следовательно, у нас нет оснований сомневаться в этой гипотезе. Если полученный (1-a)x100%-й ДИ для S не накрыл бы значение 0, то у нас появилось бы основание сомневаться в Но и отклонить ее на уровне значимости «a» (альфа). В этом смысле Р-значение и ДИ для некоего параметра сдвига можно назвать двумя сторонами одной медали.
Что касается конфузов с такими монстрами как STATISTICA и иже с ней, то за рубежом регулярно печатаются статьи о сравнении различных статистических программ с проверками согласия между ними и точности результатов. Так например конкретно было проведено сравнение 11 пакетов программ в отношении вычисления статистик Уилкоксона-Манна-Уитни. Bergmann R., Ludbrook J., Spooren W.P.J.M. (2000) Different outcomes of the Wilcoxon-Mann-Whitney test from different statistical packages. The American Statistician, Vol. 54, No. 1, pp.72-77.
Кстати, этот журнал один из немногих, которые надо регулярно читать.
Авторы рекомендуют точь в точь, что и Игорь: если исследователь собирается использовать малоизвестную программу, то надо на известном примере проверить вручную качество рачетов, производимых данной программой. На первом месте, конечно стоят StatXact, StatsDirect и модули точных методов в SAS или в SPSS, которые заимствованы из той же StatXact. Авторы упоминают Arcus QuickStat - это всего лишь старое название StatsDirect. Кроме критерия Уилкоксона-Манна-Уитни авторы рекомендуют использовать перестановочный (permutation) критерий, который также реализован в StatXact. Но для нашего примера этот критерий совпадает с критерием Уилкоксона-Манна-Уитни.
Кстати, StatsDirect тоже вполне достойная программа, ориентированная на разнообоазные и специфичные биомедицинские задачи.
Ну уж и конечно, в качестве авторитета ссылаться на Лакина не стоит. Это информация из десятых рук, из уст интепретаторов. Например, в отличие от многих других, наш учебник написан двумя математиками, имеющими многолетний опыт работы с биологами, и двумя генетиками, много лет потратившими на то, чтобы научиться понимать математиков. Много лет назад наша кафедра писала официально разгромный отзыв на очередное переиздание Лакина, но к нам почему-то не прислушались. Документ хранится в архиве Кафедры генетики и селекции СПбГУ.
Всем всех благ. Никита