![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 107 Регистрация: 27.12.2015 Пользователь №: 27815 ![]() |
Всем добрый день.
Возник вопрос касательно порядковых данных и применения одно-двух-повторного анализа данных. В R есть пакет "dunn.test" с помощью которого можно провести одномерный вариант с попарными сравнениями (dunn.test(x,g, "BY") - обычный KW. Есть пакет rms с функцией orm, частным случаем которой должен быть KW для одного вектора с порядковыми данными с разделением по подгруппам. Результат функции он выдает в виде регрессии с коэффициентами, однако возникло желание привести результат к "привычному" виду. Возникла мысль использовать конструкцию contrasts(Glm(M), list(g="a"), list(g="b")) потом "a" и "c" и "b" и "c". Результат схож (но не идентичен) с результатом dunn.test, однако уверенности в том, что так можно делать нет. 1. Насколько правомерно так тестировать контрасты для данных, измеренных в порядковой шкале? 2. Можно ли таким способом тестировать двух-трех-многовходовые порядковые данные для вычленения парных различий (использование поправки "BY" предполагается)? |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Добавлю свои 5 копеек.
Во-первых, dunn.test - это не "критерий Краскела - Уоллиса с функцией множественных парных сравнений". Это - критерий Данна. Он был предложен в Оливом Данном в 1964 г., однако распространение получил только после 1988 г, когда без указания авторства был описан в ставшей популярной монографии [Siegel, S., & Castellan, N. J. (1988). Nonparametric statistics for the behavioral sciences (2nd ed.) New York: McGraw-Hill] и потому в некоторых работах необоснованно называется именами её авторов как Siegel-Castellan test. Это - не аналог контрастов, это - прямой ранговый аналог критерия Холма - Шидака (Holm-Šidak multiple t-test), относящийся к процедурам пошагового спуска. Удерживает ошибку семейства гипотез (Familywise Error Rate, FWER) на заданном уровне. Эффективный, но отчасти консервативный метод. Используется для непараметрических множественных сравнений в пакетах Statistica и Graphpad Prizm. Таким образом, результаты линейных контрастов на рангах и результаты теста Данна и не должны быть идентичными - это разные методы. Более того, линейные контрасты по Шеффе (и какой-то их ранговый аналог, который в R получаете вы) относятся к запланированным сравнениям, тогда как критерий Данна - к множественным апостериорным (post-hoc) сравнениям. При числе групп k запланированных сравнений может быть только k-1, тогда как апостериорных - куда больше: 0,5k*(k-1). Поэтому мощность запланированных сравнений всегда выше и p должны быть меньше. Во-вторых, помимо критерия Данна для пост-хок сравнений после Краскела-Уоллиса есть ещё куча критериев: Неменьи - прямой ранговый аналог множественных сравнений по Шеффе (не путать с контрастами по Шеффе), часто некорректно называемый Schaich-Hamerle test, Стила - Двасса - прямой ранговый аналог Tukey's HSD, Коновера - Инмана - прямой ранговый аналог Fisher's LSD др. Поэтому полагаю, что результат, который вы получаете в контрастах на рангах, также имеет право на существование. Это будет подход в духе Коновера, который вообще рекомендовал всегда перед использованием параметрических тестов предварительно ранжировать значения, а расчёты проводить с рангами - типа для увеличения робастности (Conover W.J., Iman R.L. Rank Transformations as a Bridge Between Parametric and Nonparametric Statistics // The American Statistician. 1981. V. 35. N 3. P. 124-129.). Сообщение отредактировал nokh - 11.01.2016 - 23:08 |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 107 Регистрация: 27.12.2015 Пользователь №: 27815 ![]() |
Во-первых, dunn.test - это не "критерий Краскела - Уоллиса с функцией множественных парных сравнений". Это - критерий Данна. Однако https://cran.r-project.org/web/packages/dun.../dunn.test.pdf: dunn.test (x, g=NA, method=p.adjustment.methods, kw=TRUE, label=TRUE, wrap=FALSE, table=TRUE, list=FALSE, rmc=FALSE, alpha=0.05). Идентичными они быть, конечно, не должны. Но резко различаться не должны тоже. Мне пока не понятно, чем именно отличаются olm() и rlm(). Сообщение отредактировал comisora - 12.01.2016 - 11:24 |
|
![]() |
![]() |
![]() ![]() |