сравнение 5 групп по качественному признаку

сравнение 5 групп по качественному признаку

sanabat Просмотр профиля	7.03.2018 - 02:04 Сообщение #1
Группа: Пользователи Сообщений: 3 Регистрация: 7.02.2018 Пользователь №: 30961	Здравствуйте. Прошу, . У меня есть 5 независимих групп сравнения респондентов. Они отвечали на несколько вопросов 'да','нет' или 'не знаю'. Сделала таблицу 5х3. Корректно ли сравнивать ети 5 груп используя хи-квадрат? и если есть различия надо ли делать попарние сравнения? какой критерий при етом можно использовать? спасибо

Ответов

nokh Просмотр профиля	7.03.2018 - 22:36 Сообщение #2
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(sanabat @ 7.03.2018 - 04:04) ... У меня есть 5 независимих групп сравнения респондентов. Они отвечали на несколько вопросов 'да','нет' или 'не знаю'. Сделала таблицу 5х3. Корректно ли сравнивать ети 5 груп используя хи-квадрат? и если есть различия надо ли делать попарние сравнения? какой критерий при етом можно использовать? спасибо 1. Как уже было указано выше, в простом варианте задачу можно решать с использованием разных методов. Другое дело что не нужно. а) Критерий хи-квадрат Пирсона был предложен в 1901 г и до сих пор популярен. б) Его более современный аналог, известный как джи-квадрат или критерий отношения правдоподобия многократно переоткрывался в 1950-70-е потому известен также как информационный критерий Кульбака, G-критерий Вулфа, хи-квадрат максимального правдоподобия и критерий максимального логправдоподобия. Ввиду отличной теоретической проработанности (в отличие от эмпирического хи-квадрата) Сокалом и Рольфом рекомендуется использовать всегда вместо хи-квадрата. в) Поскольку а) и б) основаны на теоретическом распределении хи-квадрат для них существует проблема допустимого минимального ожидаемого, которая заключается в том, что для слабонасыщенных таблиц сопряжённости (ТС), критерии плохо аппроксимируются распределением хи-квадрат. Этого недостатка лишён рандомизационный критерий Монте-Карло (Permutation test, Monte Carlo test) который стал практически доступен только с появлением компьютеров уровня 1990-х гг. В нём р-значение получается компьютерным перебором десятков и сотен тысяч вариантов минуя любые распределения. г) Ещё лучше в) точный рандомизационный критерий (Exact permutation test). Он похож на в), но в ходе проверки генерируются не случайные таблицы с такими же краевыми частотами как у исходной, а в точности все возможные. Для ТС с большим числом наблюдений это может быть непосильной задачей даже для современных компьютеров, но это - самый точный из всех существующих функциональных аналогов. Теперь, зная это, а также то, что критерий Пирсона корректен, ответьте себе: на каком уровне вы хотите сработать в XXI веке: 1930-х, 1970-х или 1990-х годов? 2. В анализе ТС попарные сравнения не проводят. Если омнибусный критерий пункта 1 отклоняет нулевую гипотезу об отсутствии различий, то далее ищутся ячейки, давшие наибольший и неслучаный вклад в статистику критерия. Это делается с помощью расчёта отклонений Фримана - Тьюки (Freeman-Tukey deviation) или согласованных стандартизованных остатков, называемых также остатками Хабермана (Adjusted residuals). Они дают р-значение для каждой ячейки ТС. 3. Применяя схему 1+2 к каждому вопросу в отдельности вы недоиспользуете имеющуюся информацию. Почитайте про логлинейный анализ (Log-linear analysis) и анализ соответствий (Correspondence analysis). Я бы вообще начал с последнего, а обнаруженные тенденции выборочно подтвердил бы простыми тестами. 4. Варианты 1-3 подразумевают, что категории 'да','нет', 'не знаю' - номинальные. Хотя, возможно, где-то они и порядковые, т.е. "не знаю" может стоять не особняком от "да" и "нет", а между ними. Также для каких-то вопросов "не знаю" может быть почти "да", для каких-то - почти "нет" и т.п. Психологи пользуются многомерными техниками, основанными на преобразовании Джифи (Gifi) , которые позволяют оцифровать порядковые и номинальные данные и разобраться с этим. Сообщение отредактировал nokh - 7.03.2018 - 22:57

nikita_zab Просмотр профиля	5.04.2018 - 09:43 Сообщение #3
Группа: Пользователи Сообщений: 14 Регистрация: 12.03.2017 Пользователь №: 29479	Цитата(nokh @ 7.03.2018 - 22:36) в) Поскольку а) и б) основаны на теоретическом распределении хи-квадрат для них существует проблема допустимого минимального ожидаемого, которая заключается в том, что для слабонасыщенных таблиц сопряжённости (ТС), критерии плохо аппроксимируются распределением хи-квадрат. Этого недостатка лишён рандомизационный критерий Монте-Карло (Permutation test, Monte Carlo test) который стал практически доступен только с появлением компьютеров уровня 1990-х гг. В нём р-значение получается компьютерным перебором десятков и сотен тысяч вариантов минуя любые распределения. г) Ещё лучше в) точный рандомизационный критерий (Exact permutation test). Он похож на в), но в ходе проверки генерируются не случайные таблицы с такими же краевыми частотами как у исходной, а в точности все возможные. Для ТС с большим числом наблюдений это может быть непосильной задачей даже для современных компьютеров, но это - самый точный из всех существующих функциональных аналогов. Теперь, зная это, а также то, что критерий Пирсона корректен, ответьте себе: на каком уровне вы хотите сработать в XXI веке: 1930-х, 1970-х или 1990-х годов? Подскажите, пожалуйста, пакет (coin?) и функцию для методов "в" и "г".

nokh Просмотр профиля	6.04.2018 - 15:18 Сообщение #4
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(nikita_zab @ 5.04.2018 - 11:43) Подскажите, пожалуйста, пакет (coin?) и функцию для методов "в" и "г". Пока в R такого не делал, но подскажу. Когда я последний раз интересовался этим 3-5 лет назад, в R точным методом можно было обсчитать только таблицы 2 х 2, а пакета coin вроде не было. Я точным методом считал давно в StatXact, а последнее время довольствуюсь Монте-Карло в бесплатном PAST (https://folk.uio.no/ohammer/past/). Когда освоите, можете поделиться функциями здесь; в руководстве coin видел какой-то пример, но не было времени вникать. Сообщение отредактировал nokh - 6.04.2018 - 15:23

nikita_zab Просмотр профиля	5.06.2018 - 11:45 Сообщение #5
Группа: Пользователи Сообщений: 14 Регистрация: 12.03.2017 Пользователь №: 29479	Цитата(nokh @ 6.04.2018 - 15:18) Пока в R такого не делал, но подскажу. Когда я последний раз интересовался этим 3-5 лет назад, в R точным методом можно было обсчитать только таблицы 2 х 2, а пакета coin вроде не было. Я точным методом считал давно в StatXact, а последнее время довольствуюсь Монте-Карло в бесплатном PAST (https://folk.uio.no/ohammer/past/). Когда освоите, можете поделиться функциями здесь; в руководстве coin видел какой-то пример, но не было времени вникать. В пакете coin есть возможность провести тесты. Я надеюсь кому-нибудь пригодится. library(coin) tmp <- matrix( c(73, 23, 36, 86), nrow = 2, byrow = TRUE, dimnames = list( "Outcome" = c("Outcome 1", "Outcome 2"), "Factor" = c("Factor 1", "Factor 2"))) tmp <- as.table(tmp) # Permutation test, Monte Carlo test tmp <- chisq_test(tmp, distribution = approximate(B = 10000)) pvalue(tmp) midpvalue(tmp) # Exact permutation test tmp <- chisq_test(tmp, distribution = "exact") pvalue(tmp) midpvalue(tmp)

Сообщений в этой теме

sanabat сравнение 5 групп по качественному признаку 7.03.2018 - 02:04

leo_biostat sanabat, ! Да, корректно использовать критери... 7.03.2018 - 08:13

Rebecca ого как много интересного. а зачем эти 5 групп нуж... 7.03.2018 - 11:20

leo_biostat Цитата(Rebecca @ 7.03.2018 - 11:20) ... 7.03.2018 - 14:51

nokh Цитата(sanabat @ 7.03.2018 - 04:04) ... 7.03.2018 - 22:36

nikita_zab Цитата(nokh @ 7.03.2018 - 22:36) в) ... 5.04.2018 - 09:43

nokh Цитата(nikita_zab @ 5.04.2018 - 11:4... 6.04.2018 - 15:18

nikita_zab Цитата(nokh @ 6.04.2018 - 15:18) Пок... 5.06.2018 - 11:45

100$ Цитата(nikita_zab @ 5.04.2018 - 09:4... 6.04.2018 - 15:57

nokh Цитата(100$ @ 6.04.2018 - 17:57... 6.04.2018 - 16:07

100$ Цитата(nokh @ 6.04.2018 - 16:07) Кри... 6.04.2018 - 16:58

DrgLena Цитата(Rebecca @ 7.03.2018 - 11:20) ... 7.03.2018 - 23:51

100$ А теперь дадим слово разработчикам SPSS: Monte Ca... 6.04.2018 - 20:08

nokh Цитата(100$ @ 6.04.2018 - 22:08... 7.04.2018 - 08:35

100$ Цитатат.к. итак узнал сегодня много нового:)). Ва... 7.04.2018 - 17:07

nokh Цитата(100$ @ 7.04.2018 - 19:07... 7.04.2018 - 18:12

100$ Цитата(nokh @ 7.04.2018 - 18:12) Авт... 7.04.2018 - 18:41

DrgLena RE: сравнение 5 групп по качественному признаку 7.04.2018 - 22:33

100$ Цитата(DrgLena @ 7.04.2018 - 22:33) ... 7.04.2018 - 22:56

« Предыдущая тема · Медицинская статистика · Следующая тема »