Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> сравнение 5 групп по качественному признаку
sanabat
сообщение 7.03.2018 - 02:04
Сообщение #1





Группа: Пользователи
Сообщений: 3
Регистрация: 7.02.2018
Пользователь №: 30961



Здравствуйте. Прошу, help.gif. У меня есть 5 независимих групп сравнения респондентов. Они отвечали на несколько вопросов 'да','нет' или 'не знаю'. Сделала таблицу 5х3. Корректно ли сравнивать ети 5 груп используя хи-квадрат? и если есть различия надо ли делать попарние сравнения? какой критерий при етом можно использовать? спасибо
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 7.03.2018 - 22:36
Сообщение #2





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(sanabat @ 7.03.2018 - 04:04) *
... У меня есть 5 независимих групп сравнения респондентов. Они отвечали на несколько вопросов 'да','нет' или 'не знаю'. Сделала таблицу 5х3. Корректно ли сравнивать ети 5 груп используя хи-квадрат? и если есть различия надо ли делать попарние сравнения? какой критерий при етом можно использовать? спасибо

1. Как уже было указано выше, в простом варианте задачу можно решать с использованием разных методов. Другое дело что не нужно.
а) Критерий хи-квадрат Пирсона был предложен в 1901 г и до сих пор популярен.
б) Его более современный аналог, известный как джи-квадрат или критерий отношения правдоподобия многократно переоткрывался в 1950-70-е потому известен также как информационный критерий Кульбака, G-критерий Вулфа, хи-квадрат максимального правдоподобия и критерий максимального логправдоподобия. Ввиду отличной теоретической проработанности (в отличие от эмпирического хи-квадрата) Сокалом и Рольфом рекомендуется использовать всегда вместо хи-квадрата.
в) Поскольку а) и б) основаны на теоретическом распределении хи-квадрат для них существует проблема допустимого минимального ожидаемого, которая заключается в том, что для слабонасыщенных таблиц сопряжённости (ТС), критерии плохо аппроксимируются распределением хи-квадрат. Этого недостатка лишён рандомизационный критерий Монте-Карло (Permutation test, Monte Carlo test) который стал практически доступен только с появлением компьютеров уровня 1990-х гг. В нём р-значение получается компьютерным перебором десятков и сотен тысяч вариантов минуя любые распределения.
г) Ещё лучше в) точный рандомизационный критерий (Exact permutation test). Он похож на в), но в ходе проверки генерируются не случайные таблицы с такими же краевыми частотами как у исходной, а в точности все возможные. Для ТС с большим числом наблюдений это может быть непосильной задачей даже для современных компьютеров, но это - самый точный из всех существующих функциональных аналогов.
Теперь, зная это, а также то, что критерий Пирсона корректен, ответьте себе: на каком уровне вы хотите сработать в XXI веке: 1930-х, 1970-х или 1990-х годов?

2. В анализе ТС попарные сравнения не проводят. Если омнибусный критерий пункта 1 отклоняет нулевую гипотезу об отсутствии различий, то далее ищутся ячейки, давшие наибольший и неслучаный вклад в статистику критерия. Это делается с помощью расчёта отклонений Фримана - Тьюки (Freeman-Tukey deviation) или согласованных стандартизованных остатков, называемых также остатками Хабермана (Adjusted residuals). Они дают р-значение для каждой ячейки ТС.

3. Применяя схему 1+2 к каждому вопросу в отдельности вы недоиспользуете имеющуюся информацию. Почитайте про логлинейный анализ (Log-linear analysis) и анализ соответствий (Correspondence analysis). Я бы вообще начал с последнего, а обнаруженные тенденции выборочно подтвердил бы простыми тестами.

4. Варианты 1-3 подразумевают, что категории 'да','нет', 'не знаю' - номинальные. Хотя, возможно, где-то они и порядковые, т.е. "не знаю" может стоять не особняком от "да" и "нет", а между ними. Также для каких-то вопросов "не знаю" может быть почти "да", для каких-то - почти "нет" и т.п. Психологи пользуются многомерными техниками, основанными на преобразовании Джифи (Gifi) , которые позволяют оцифровать порядковые и номинальные данные и разобраться с этим.

Сообщение отредактировал nokh - 7.03.2018 - 22:57
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nikita_zab
сообщение 5.04.2018 - 09:43
Сообщение #3





Группа: Пользователи
Сообщений: 14
Регистрация: 12.03.2017
Пользователь №: 29479



Цитата(nokh @ 7.03.2018 - 22:36) *
в) Поскольку а) и б) основаны на теоретическом распределении хи-квадрат для них существует проблема допустимого минимального ожидаемого, которая заключается в том, что для слабонасыщенных таблиц сопряжённости (ТС), критерии плохо аппроксимируются распределением хи-квадрат. Этого недостатка лишён рандомизационный критерий Монте-Карло (Permutation test, Monte Carlo test) который стал практически доступен только с появлением компьютеров уровня 1990-х гг. В нём р-значение получается компьютерным перебором десятков и сотен тысяч вариантов минуя любые распределения.
г) Ещё лучше в) точный рандомизационный критерий (Exact permutation test). Он похож на в), но в ходе проверки генерируются не случайные таблицы с такими же краевыми частотами как у исходной, а в точности все возможные. Для ТС с большим числом наблюдений это может быть непосильной задачей даже для современных компьютеров, но это - самый точный из всех существующих функциональных аналогов.
Теперь, зная это, а также то, что критерий Пирсона корректен, ответьте себе: на каком уровне вы хотите сработать в XXI веке: 1930-х, 1970-х или 1990-х годов?


Подскажите, пожалуйста, пакет (coin?) и функцию для методов "в" и "г".
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 6.04.2018 - 15:18
Сообщение #4





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(nikita_zab @ 5.04.2018 - 11:43) *
Подскажите, пожалуйста, пакет (coin?) и функцию для методов "в" и "г".

Пока в R такого не делал, но подскажу. Когда я последний раз интересовался этим 3-5 лет назад, в R точным методом можно было обсчитать только таблицы 2 х 2, а пакета coin вроде не было. Я точным методом считал давно в StatXact, а последнее время довольствуюсь Монте-Карло в бесплатном PAST (https://folk.uio.no/ohammer/past/). Когда освоите, можете поделиться функциями здесь; в руководстве coin видел какой-то пример, но не было времени вникать.

Сообщение отредактировал nokh - 6.04.2018 - 15:23
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nikita_zab
сообщение 5.06.2018 - 11:45
Сообщение #5





Группа: Пользователи
Сообщений: 14
Регистрация: 12.03.2017
Пользователь №: 29479



Цитата(nokh @ 6.04.2018 - 15:18) *
Пока в R такого не делал, но подскажу. Когда я последний раз интересовался этим 3-5 лет назад, в R точным методом можно было обсчитать только таблицы 2 х 2, а пакета coin вроде не было. Я точным методом считал давно в StatXact, а последнее время довольствуюсь Монте-Карло в бесплатном PAST (https://folk.uio.no/ohammer/past/). Когда освоите, можете поделиться функциями здесь; в руководстве coin видел какой-то пример, но не было времени вникать.


В пакете coin есть возможность провести тесты. Я надеюсь кому-нибудь пригодится.

library(coin)
tmp <- matrix(
c(73, 23,
36, 86),
nrow = 2, byrow = TRUE,
dimnames = list(
"Outcome" = c("Outcome 1", "Outcome 2"),
"Factor" = c("Factor 1", "Factor 2")))
tmp <- as.table(tmp)

# Permutation test, Monte Carlo test
tmp <- chisq_test(tmp, distribution = approximate(B = 10000))
pvalue(tmp)
midpvalue(tmp)

# Exact permutation test
tmp <- chisq_test(tmp, distribution = "exact")
pvalue(tmp)
midpvalue(tmp)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- sanabat   сравнение 5 групп по качественному признаку   7.03.2018 - 02:04
- - leo_biostat   sanabat, ! Да, корректно использовать критери...   7.03.2018 - 08:13
- - Rebecca   ого как много интересного. а зачем эти 5 групп нуж...   7.03.2018 - 11:20
|- - leo_biostat   Цитата(Rebecca @ 7.03.2018 - 11:20) ...   7.03.2018 - 14:51
- - nokh   Цитата(sanabat @ 7.03.2018 - 04:04) ...   7.03.2018 - 22:36
|- - nikita_zab   Цитата(nokh @ 7.03.2018 - 22:36) в) ...   5.04.2018 - 09:43
|- - nokh   Цитата(nikita_zab @ 5.04.2018 - 11:4...   6.04.2018 - 15:18
||- - nikita_zab   Цитата(nokh @ 6.04.2018 - 15:18) Пок...   5.06.2018 - 11:45
|- - 100$   Цитата(nikita_zab @ 5.04.2018 - 09:4...   6.04.2018 - 15:57
|- - nokh   Цитата(100$ @ 6.04.2018 - 17:57...   6.04.2018 - 16:07
|- - 100$   Цитата(nokh @ 6.04.2018 - 16:07) Кри...   6.04.2018 - 16:58
- - DrgLena   Цитата(Rebecca @ 7.03.2018 - 11:20) ...   7.03.2018 - 23:51
- - 100$   А теперь дадим слово разработчикам SPSS: Monte Ca...   6.04.2018 - 20:08
|- - nokh   Цитата(100$ @ 6.04.2018 - 22:08...   7.04.2018 - 08:35
|- - 100$   Цитатат.к. итак узнал сегодня много нового:)). Ва...   7.04.2018 - 17:07
|- - nokh   Цитата(100$ @ 7.04.2018 - 19:07...   7.04.2018 - 18:12
|- - 100$   Цитата(nokh @ 7.04.2018 - 18:12) Авт...   7.04.2018 - 18:41
- - DrgLena   RE: сравнение 5 групп по качественному признаку   7.04.2018 - 22:33
- - 100$   Цитата(DrgLena @ 7.04.2018 - 22:33) ...   7.04.2018 - 22:56


Добавить ответ в эту темуОткрыть тему