Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

13 страниц V   1 2 3 > »   
Добавить ответ в эту темуОткрыть тему
> Непараметрическая статистика, различия в результатах анализа по Фридмену и теста Уилкоксона
dimcuslongus
сообщение 20.07.2009 - 21:30
Сообщение #1


Дух форума
*

Группа: Пользователи
Сообщений: 3
Регистрация: 17.10.2005
Пользователь №: 555



Добрый вечер!
У меня похожая ситуация, что и у PantheraBagira, только переменные зависимые (трижды в динамике оценивается выраженность неврологического дефицита у одних и тех же пациентов). При анализе по Фридмену различия значимые (p<0,0000), при использовании теста Уилкоксона между 1-ой и 2-ой оценкой p "на грани" = 0,0170. При использовании критерия знаков для этой же пары различия значимые (p = 0,0022). Подскажите, как интерпретировать такие результаты? Спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 22.07.2009 - 21:52
Сообщение #2


Дух форума
*

Группа: Пользователи
Сообщений: 1057
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(dimcuslongus @ 21.07.2009 - 00:30) *
...При анализе по Фридмену различия значимые (p<0,0000), при использовании теста Уилкоксона между 1-ой и 2-ой оценкой p "на грани" = 0,0170. При использовании критерия знаков для этой же пары различия значимые (p = 0,0022). Подскажите, как интерпретировать такие результаты? Спасибо!

Для такой задачи лучше использовать дисперсионный анализ с повторными наблюдениями, а сравнения между сроками проводить внутри всего дисперсионного комплекса. Если требуется - преобразовать исходные данные. В этом случае информация будет использована по максимуму. В случае анализа Фридмана в качестве значений для разных сроков можно использовать средние ранги и не проводить парных сравнений. По поводу критерия Уилкоксона для разностей пар не понятно на грани чего находится P? В подавляющем большинстве исследований достаточным принимается пятипроцентный уровень значимости. С этой позиции P=0,0170 и P=0,0022 - одно и то же. Если выборки, образующие пары, имеют распределение одного типа - лучше использовать критерий Уилкоксона: он строже и мощнее. Критерий знаков более либерален к данным, но обладает сходной эффективностью только на очень малых выборках (для n=6 - 95%), а при увеличении n его эффективность снижается вплоть до 64%.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
dimcuslongus
сообщение 23.07.2009 - 18:42
Сообщение #3


Дух форума
*

Группа: Пользователи
Сообщений: 3
Регистрация: 17.10.2005
Пользователь №: 555



Спасибо!
"На грани" - я использовал поправку Бонферрони для 3 сравнений - p = 0,05 / 3 = 0,017.

Сообщение отредактировал dimcuslongus - 23.07.2009 - 18:43
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
avorotniak
сообщение 24.07.2009 - 19:16
Сообщение #4


Дух форума
*

Группа: Пользователи
Сообщений: 23
Регистрация: 24.07.2009
Пользователь №: 6183



В отношении непараметрического подхода:

Основными непараметрическими аналогами 2-х факторного ANOVA являются критерии Friedman и Quade (оба критерия основаны на рангах). Первый из них является продолжением критерия знаков, для более 2-х связанных выборок, а второй - продолжением критерия Уилкоксона. (Кстати, для двух выборок, Friedman полностью совпадает с критерием знаков, а Quade - с критерием Уилкоксона). Критерий Quade мощнее, чем Friedman, поэтому предпочтительней. Для каждого из указанных критериев существуют формулы для попарного сравнения (если отвергнута основная гипотеза).

Для использования критерия Уилкоксона нужно проверить данные на симметрию (в отношении Quade не имею точной информации по этому поводу) . Если данные не симметричны и нет возоможности их трансформации, то лучше использовать критерий знаков или Friedman.

Успехов
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 25.07.2009 - 06:41
Сообщение #5


Дух форума
*

Группа: Пользователи
Сообщений: 964
Регистрация: 10.04.2007
Из: Россия
Пользователь №: 4040



Цитата(avorotniak @ 24.07.2009 - 20:16) *
В отношении непараметрического подхода:

Основными непараметрическими аналогами 2-х факторного ANOVA являются критерии Friedman и Quade (оба критерия основаны на рангах). Первый из них является продолжением критерия знаков, для более 2-х связанных выборок, а второй ? продолжением критерия Уилкоксона. (Кстати, для двух выборок, Friedman полностью совпадает с критерием знаков, а Quade ? с критерием Уилкоксона). Критерий Quade мощнее, чем Friedman, поэтому предпочтительней. Для каждого из указанных критериев существуют формулы для попарного сравнения (если отвергнута основная гипотеза).
Для использования критерия Уилкоксона нужно проверить данные на симметрию (в отношении Quade не имею точной информации по этому поводу) . Если данные не симметричны и нет возоможности их трансформации, то лучше использовать критерий знаков или Friedman.

Успехов

Критерий Квейд хорошо описан в руководстве Солиани. http://www.dsa.unipr.it/soliani/capu15.pdf (с. 85). Правда, на итальянском smile.gif, но формулы понятны и так.

Сообщение отредактировал Игорь - 25.07.2009 - 15:59


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 25.07.2009 - 10:31
Сообщение #6


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573



На английском тоже этот критерий тоже хорошо описан, но Avorotniak утверждает, что он более мощный чем критерий Фридмана, а потому, предпочтительней. Однако, это верно только для небольшого числа связанных выборок, как в данном случае (3), в то время как тест Фридмана более мощный, когда их число пять или больше.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 25.07.2009 - 13:58
Сообщение #7


Дух форума
*

Группа: Пользователи
Сообщений: 964
Регистрация: 10.04.2007
Из: Россия
Пользователь №: 4040



Цитата(DrgLena @ 25.07.2009 - 10:31) *
На английском тоже этот критерий тоже хорошо описан, но Avorotniak утверждает, что он более мощный чем критерий Фридмана, а потому, предпочтительней. Однако, это верно только для небольшого числа связанных выборок, как в данном случае (3), в то время как тест Фридмана более мощный, когда их число пять или больше.

Если не затруднит, укажите, пожалуйста, английский источник. И что за Avorotniak?


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 25.07.2009 - 15:15
Сообщение #8


Дух форума
*

Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Игорь @ 25.07.2009 - 14:58) *
И что за Avorotniak?

Сообщение #4 в этой ветке smile.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 25.07.2009 - 16:02
Сообщение #9


Дух форума
*

Группа: Пользователи
Сообщений: 964
Регистрация: 10.04.2007
Из: Россия
Пользователь №: 4040



Цитата(плав @ 25.07.2009 - 15:15) *
Сообщение #4 в этой ветке smile.gif

Спасибо. Кстати, у Soliani как раз даны формулы для попарных сравнений в критерии Квейд. Критерий почему-то мало известен. Надо его популяризовать.

Критерий представлен в известной монографии Conover. Однако ознакомиться с данным источником не удалось.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
avorotniak
сообщение 25.07.2009 - 18:03
Сообщение #10


Дух форума
*

Группа: Пользователи
Сообщений: 23
Регистрация: 24.07.2009
Пользователь №: 6183



Ссылки на критерий Квейда:
D. Quade (1979), Using weighted rankings in the analysis of complete blocks with additive block effects. Journal of the American Statistical Association, 74, 680?683.
William J. Conover (1999), Practical nonparametric statistics. New York: John Wiley & Sons. Pages 373?380.
В ?R? этот критерий вызывается командой quade.test()

Однако у Soliani (спасибо Игорю) также можно найти все необходимые формулы.
По поводу преимуществ Квейда, согласен с DrgLena.
Чтобы интуитивно понять эти преимущества предлагаю следующее:

Для подсчета статистики Фридмана используются R.j , при этом сначала определяются ранги внутри каждого блока Rij, а потом они суммируются по столбикам (treatments). В результате теряется ?межблочный? эффект. Это использовал Quade ?Using weighted rankings in the analysis of complete blocks with additive block effects?. Статистика Квейда основана на Sij = Qi*(Rij ? (k+1)/2), где Qi как раз и представляет собой взвешивание каждого блока. Qi это ранг каждого блока i в зависимости от range in block i = max Xij - min Xij. Таким образом, критерий Квейда использует больше информации, чем Фридман.

Успехов
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 25.07.2009 - 18:32
Сообщение #11


Дух форума
*

Группа: Пользователи
Сообщений: 1057
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



По-русски причитать про Quade test с разбором на примере можно в Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2006. - 816 с. (есть в сети в djvu). Там он на стр. 487 и называется "Критерий со взвешенными ранжировками Даны Квейд".
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 25.07.2009 - 18:33
Сообщение #12


Дух форума
*

Группа: Пользователи
Сообщений: 964
Регистрация: 10.04.2007
Из: Россия
Пользователь №: 4040



Всем спасибо за информацию.

Oops!!! У Soliani пример посчитан неверно. Неаккуратно сделано ранжирование (ошибки в 3-х местах). Отсюда весь остальной расчет неверен.

Чтобы пример был хотя бы формально верен, предлагаю поменять исходные данные. Если исходные данные взять такие (показано в транспонированном виде)

115 28 220 82 298 294 98
142 31 311 56 256 322 87
36 7 108 33 46 176 55
91 21 51 46 124 54 84
28 6 117 24 84 86 25

то результатами можно воспользоваться в учебно-познавательных целях.

Еще в формуле для W ошибка. Малыми литерами r обозначен массив рангов, а на самом деле должен быть подставлен (и подставлен в примере) модифицированный массив рангов. Небрежность автора.

Да, кстати, верное замечание. Квейд - это "она".

Сообщение отредактировал Игорь - 25.07.2009 - 19:02


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 25.07.2009 - 19:44
Сообщение #13


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573



Англоязычный источник - техническая документация к StatXact8, но пример там другой. Документация мне досталась от демо версии программы (pdf 12.3 МБ). Кроме уже указанных выше источников, есть немного в журнальных статьях:

Campbell RA. A comparison of the Quade and Friedman tests to the unbalanced two-way analysis of variance with biomedical data.
Comput Biol Med. 1988;18(6):441-7.

Theodorsson-Norheim E. Friedman and Quade tests: BASIC computer program to perform nonparametric two-way analysis of variance and multiple comparisons on ranks of several related samples.
Comput Biol Med. 1987;17(2):85-99
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 25.07.2009 - 21:23
Сообщение #14


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573



Для данных в итальянском источнике, действительно, значение статистики будет 10,38 а при исправлении рангов, как представил Игорь, получается 9,217, т.е. как в источнике. При этом двухсторонее значение р=0.0001167 (Asymptotic) и р=2.536e-005 (Exact).
Полезный критерий, да еще женский. Пример в StatXact значительно проще:

23 58 11 24 34
23 53 10 20 40
23 54 22 21 22

Полезные упражнения, однако, спасибо всем!

Сообщение отредактировал DrgLena - 25.07.2009 - 21:30
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
avorotniak
сообщение 25.07.2009 - 23:22
Сообщение #15


Дух форума
*

Группа: Пользователи
Сообщений: 23
Регистрация: 24.07.2009
Пользователь №: 6183




Хотелось бы возвратиться к исходной проблеме, предложенной dimcuslongus :

Я так понимаю, что имеет место дизайн полных блоков, то есть в строчках располагаются пациенты (blocks), а в колонках 3 неврологических измерения (treatments). Кроме классической постановки проблемы, Но: все медианы равны против Н1: имеются различия, можно бы сформулировать альтернативную гипотезу по другому: m1 <= m2 <= m3 (по крайней мере с одной строгой неравностью). Например, если нас интересует имелось ли улучшение оценки неврологического статуса пациентов в процессе наблюдения. Для такой гипотезы Page (1963) предложил следующую статистику:

Т = (1/sqrt(n))*sum ((j - (k+1)/2)*(R.j - n*(k+1)/2))
Var(T) = k^2(k^2 - 1)*(k+1)/144

Отвергаем Но если T > z(alfa) sqrt(Var(T)) , где z(alfa) соответствующий перцентиль нормального распределения. Думаю, что в указанной проблеме было бы интересно использовать этот критерий.

Взято из T. Hettmansperger Statistical Inference Based on Ranks
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

13 страниц V   1 2 3 > » 
Добавить ответ в эту темуОткрыть тему