Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Краскел-Уоллис как регрессия, Все про R
comisora
сообщение 27.12.2015 - 11:28
Сообщение #1





Группа: Пользователи
Сообщений: 107
Регистрация: 27.12.2015
Пользователь №: 27815



Всем добрый день.
Возник вопрос касательно порядковых данных и применения одно-двух-повторного анализа данных. В R есть пакет "dunn.test" с помощью которого можно провести одномерный вариант с попарными сравнениями (dunn.test(x,g, "BY") - обычный KW. Есть пакет rms с функцией orm, частным случаем которой должен быть KW для одного вектора с порядковыми данными с разделением по подгруппам. Результат функции он выдает в виде регрессии с коэффициентами, однако возникло желание привести результат к "привычному" виду. Возникла мысль использовать конструкцию contrasts(Glm(M), list(g="a"), list(g="b")) потом "a" и "c" и "b" и "c". Результат схож (но не идентичен) с результатом dunn.test, однако уверенности в том, что так можно делать нет.
1. Насколько правомерно так тестировать контрасты для данных, измеренных в порядковой шкале?
2. Можно ли таким способом тестировать двух-трех-многовходовые порядковые данные для вычленения парных различий (использование поправки "BY" предполагается)?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 11.01.2016 - 22:33
Сообщение #2





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Добавлю свои 5 копеек.
Во-первых, dunn.test - это не "критерий Краскела - Уоллиса с функцией множественных парных сравнений". Это - критерий Данна. Он был предложен в Оливом Данном в 1964 г., однако распространение получил только после 1988 г, когда без указания авторства был описан в ставшей популярной монографии [Siegel, S., & Castellan, N. J. (1988). Nonparametric statistics for the behavioral sciences (2nd ed.) New York: McGraw-Hill] и потому в некоторых работах необоснованно называется именами её авторов как Siegel-Castellan test. Это - не аналог контрастов, это - прямой ранговый аналог критерия Холма - Шидака (Holm-Šidak multiple t-test), относящийся к процедурам пошагового спуска. Удерживает ошибку семейства гипотез (Familywise Error Rate, FWER) на заданном уровне. Эффективный, но отчасти консервативный метод. Используется для непараметрических множественных сравнений в пакетах Statistica и Graphpad Prizm.

Таким образом, результаты линейных контрастов на рангах и результаты теста Данна и не должны быть идентичными - это разные методы. Более того, линейные контрасты по Шеффе (и какой-то их ранговый аналог, который в R получаете вы) относятся к запланированным сравнениям, тогда как критерий Данна - к множественным апостериорным (post-hoc) сравнениям. При числе групп k запланированных сравнений может быть только k-1, тогда как апостериорных - куда больше: 0,5k*(k-1). Поэтому мощность запланированных сравнений всегда выше и p должны быть меньше.

Во-вторых, помимо критерия Данна для пост-хок сравнений после Краскела-Уоллиса есть ещё куча критериев: Неменьи - прямой ранговый аналог множественных сравнений по Шеффе (не путать с контрастами по Шеффе), часто некорректно называемый Schaich-Hamerle test, Стила - Двасса - прямой ранговый аналог Tukey's HSD, Коновера - Инмана - прямой ранговый аналог Fisher's LSD др. Поэтому полагаю, что результат, который вы получаете в контрастах на рангах, также имеет право на существование. Это будет подход в духе Коновера, который вообще рекомендовал всегда перед использованием параметрических тестов предварительно ранжировать значения, а расчёты проводить с рангами - типа для увеличения робастности (Conover W.J., Iman R.L. Rank Transformations as a Bridge Between Parametric and Nonparametric Statistics // The American Statistician. 1981. V. 35. N 3. P. 124-129.).

Сообщение отредактировал nokh - 11.01.2016 - 23:08
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
comisora
сообщение 12.01.2016 - 11:22
Сообщение #3





Группа: Пользователи
Сообщений: 107
Регистрация: 27.12.2015
Пользователь №: 27815



Цитата(nokh @ 11.01.2016 - 22:33) *
Во-первых, dunn.test - это не "критерий Краскела - Уоллиса с функцией множественных парных сравнений". Это - критерий Данна.

Однако https://cran.r-project.org/web/packages/dun.../dunn.test.pdf:
dunn.test (x, g=NA, method=p.adjustment.methods, kw=TRUE, label=TRUE, wrap=FALSE, table=TRUE, list=FALSE, rmc=FALSE, alpha=0.05).
Идентичными они быть, конечно, не должны. Но резко различаться не должны тоже. Мне пока не понятно, чем именно отличаются olm() и rlm().

Сообщение отредактировал comisora - 12.01.2016 - 11:24
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему