сравнение 5 групп по качественному признаку |
Здравствуйте, гость ( Вход | Регистрация )
сравнение 5 групп по качественному признаку |
7.03.2018 - 02:04
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 7.02.2018 Пользователь №: 30961 |
Здравствуйте. Прошу, . У меня есть 5 независимих групп сравнения респондентов. Они отвечали на несколько вопросов 'да','нет' или 'не знаю'. Сделала таблицу 5х3. Корректно ли сравнивать ети 5 груп используя хи-квадрат? и если есть различия надо ли делать попарние сравнения? какой критерий при етом можно использовать? спасибо
|
|
7.03.2018 - 22:36
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
... У меня есть 5 независимих групп сравнения респондентов. Они отвечали на несколько вопросов 'да','нет' или 'не знаю'. Сделала таблицу 5х3. Корректно ли сравнивать ети 5 груп используя хи-квадрат? и если есть различия надо ли делать попарние сравнения? какой критерий при етом можно использовать? спасибо 1. Как уже было указано выше, в простом варианте задачу можно решать с использованием разных методов. Другое дело что не нужно. а) Критерий хи-квадрат Пирсона был предложен в 1901 г и до сих пор популярен. б) Его более современный аналог, известный как джи-квадрат или критерий отношения правдоподобия многократно переоткрывался в 1950-70-е потому известен также как информационный критерий Кульбака, G-критерий Вулфа, хи-квадрат максимального правдоподобия и критерий максимального логправдоподобия. Ввиду отличной теоретической проработанности (в отличие от эмпирического хи-квадрата) Сокалом и Рольфом рекомендуется использовать всегда вместо хи-квадрата. в) Поскольку а) и б) основаны на теоретическом распределении хи-квадрат для них существует проблема допустимого минимального ожидаемого, которая заключается в том, что для слабонасыщенных таблиц сопряжённости (ТС), критерии плохо аппроксимируются распределением хи-квадрат. Этого недостатка лишён рандомизационный критерий Монте-Карло (Permutation test, Monte Carlo test) который стал практически доступен только с появлением компьютеров уровня 1990-х гг. В нём р-значение получается компьютерным перебором десятков и сотен тысяч вариантов минуя любые распределения. г) Ещё лучше в) точный рандомизационный критерий (Exact permutation test). Он похож на в), но в ходе проверки генерируются не случайные таблицы с такими же краевыми частотами как у исходной, а в точности все возможные. Для ТС с большим числом наблюдений это может быть непосильной задачей даже для современных компьютеров, но это - самый точный из всех существующих функциональных аналогов. Теперь, зная это, а также то, что критерий Пирсона корректен, ответьте себе: на каком уровне вы хотите сработать в XXI веке: 1930-х, 1970-х или 1990-х годов? 2. В анализе ТС попарные сравнения не проводят. Если омнибусный критерий пункта 1 отклоняет нулевую гипотезу об отсутствии различий, то далее ищутся ячейки, давшие наибольший и неслучаный вклад в статистику критерия. Это делается с помощью расчёта отклонений Фримана - Тьюки (Freeman-Tukey deviation) или согласованных стандартизованных остатков, называемых также остатками Хабермана (Adjusted residuals). Они дают р-значение для каждой ячейки ТС. 3. Применяя схему 1+2 к каждому вопросу в отдельности вы недоиспользуете имеющуюся информацию. Почитайте про логлинейный анализ (Log-linear analysis) и анализ соответствий (Correspondence analysis). Я бы вообще начал с последнего, а обнаруженные тенденции выборочно подтвердил бы простыми тестами. 4. Варианты 1-3 подразумевают, что категории 'да','нет', 'не знаю' - номинальные. Хотя, возможно, где-то они и порядковые, т.е. "не знаю" может стоять не особняком от "да" и "нет", а между ними. Также для каких-то вопросов "не знаю" может быть почти "да", для каких-то - почти "нет" и т.п. Психологи пользуются многомерными техниками, основанными на преобразовании Джифи (Gifi) , которые позволяют оцифровать порядковые и номинальные данные и разобраться с этим. Сообщение отредактировал nokh - 7.03.2018 - 22:57 |
|
5.04.2018 - 09:43
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 12.03.2017 Пользователь №: 29479 |
в) Поскольку а) и б) основаны на теоретическом распределении хи-квадрат для них существует проблема допустимого минимального ожидаемого, которая заключается в том, что для слабонасыщенных таблиц сопряжённости (ТС), критерии плохо аппроксимируются распределением хи-квадрат. Этого недостатка лишён рандомизационный критерий Монте-Карло (Permutation test, Monte Carlo test) который стал практически доступен только с появлением компьютеров уровня 1990-х гг. В нём р-значение получается компьютерным перебором десятков и сотен тысяч вариантов минуя любые распределения. г) Ещё лучше в) точный рандомизационный критерий (Exact permutation test). Он похож на в), но в ходе проверки генерируются не случайные таблицы с такими же краевыми частотами как у исходной, а в точности все возможные. Для ТС с большим числом наблюдений это может быть непосильной задачей даже для современных компьютеров, но это - самый точный из всех существующих функциональных аналогов. Теперь, зная это, а также то, что критерий Пирсона корректен, ответьте себе: на каком уровне вы хотите сработать в XXI веке: 1930-х, 1970-х или 1990-х годов? Подскажите, пожалуйста, пакет (coin?) и функцию для методов "в" и "г". |
|
6.04.2018 - 15:57
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Подскажите, пожалуйста, пакет (coin?) и функцию для методов "в" и "г". Судя по всему, да - coin. Что-то, наверное, можно выжать и из perm. Однако, "рабочая лошадка" exact-методов в рамках Фишеровской парадигмы - fisher.test(), применимый не только к таблицам 2х2, но и RxC (в каковом случае он называется критерием Фишера - Фримана - Холтона). |
|
6.04.2018 - 16:07
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Судя по всему, да - coin. Что-то, наверное, можно выжать и из perm. Однако, "рабочая лошадка" exact-методов в рамках Фишеровской парадигмы - fisher.test(), применимый не только к таблицам 2х2, но и RxC (в каковом случае он называется критерием Фишера - Фримана - Холтона). Критерий Фишера разработан на основе гипергеометрического распределения, тогда как в реальной жизни мы не имеем фиксированных краевых частот таблицы сопряжённости по всем входам. Т.е. критерий предполагает гипергеометрическое распределение, а мы используем его на практике для анализа би- или полиномиального распределения. С теоретической точки зрения это нехорошо, хотя на практике выводы получаются сходными. Поэтому лучше пытаться реализовать точный рандомизационный критерий или Монте-Карло. Сообщение отредактировал nokh - 6.04.2018 - 16:07 |
|