Анализ качественных данных |
Здравствуйте, гость ( Вход | Регистрация )
Анализ качественных данных |
30.01.2008 - 10:36
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 30.01.2008 Пользователь №: 4759 |
Подскажите какими методами можно провести анализ качественных порядковых данных относительно одной качественной величины для трех и более независимых групп при ненормальном распределении
|
|
30.01.2008 - 11:43
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 16 Регистрация: 12.10.2004 Пользователь №: 10 |
Не могу дать точный ответ, но есть замечательная книга Реброва О. Ю.
Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA Где все подробно и доступно описано. Пользовались книгой знакомые и я сейчас её осваиваю. |
|
30.01.2008 - 17:47
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 30.01.2008 Пользователь №: 4760 |
Подскажите какими методами можно провести анализ качественных порядковых данных относительно одной качественной величины для трех и более независимых групп при ненормальном распределении Первое, что на ум приходит -- к анализу таблиц сопряжености добавить ранговые корреляции, например Кендала. Даже если градаций мало в этой самой порядковой переменной -- вполне допустимо. Можно меры связи для упорядоченных градаций таблицы сопряженности, типа D Соммера или гамма ( к-нт Юла в терминах экономистов) попробовать.А можно и условия поточнее сформулировать. Не очень понятно, о какой нормальности-неромальности идёт речь, если данные качественные, порядковые. |
|
31.01.2008 - 11:42
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 30.01.2008 Пользователь №: 4759 |
А можно и условия поточнее сформулировать. Не очень понятно, о какой нормальности-неромальности идёт речь, если данные качественные, порядковые. Извините дилетанта, постараюсь уточнить: мне необходимо выяснить достоверны ли различия между группами. Я хочу сравнить шесть независимых групп по качественным порядковым данным (степеням вредности условий труда). Подскажите пожалуйста как это сделать? |
|
31.01.2008 - 12:41
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Из широко известных методов на выбор:
- критерий Краскела-Уоллиса, - критерий Данна, - критерий Джонкхиера-Терпстра, - L-критерий Пэйджа, - ранговый критерий Фридмана. Аннотированный список источников: 1. Бикел П., Доксам К. Математическая статистика. Вып. 2. - М.: Финансы и статистика, 1983. Классика жанра. 2. Браунли К.А. Статистическая теория и методология в науке и технике. - М.: Наука, 1977. Просто, строго, понятно и доступно. 3. Гланц С. Медико-биологическая статистика. - М.: Практика, 1988. Для первоначального знакомства. 4. Лисенков А.Н. Математические методы планирования многофакторных медико-биологических экспериментов. - М.: Медицина, 1979. К тому же в тему (медицина). 5. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере. - М.: ИНФРА-М, 1999. Есть и более ранние, и более поздние переиздания. 6. Холлендер М., Вулф Д. Непараметрические методы статистики. - М.: Финансы и статистика, 1983. Одна из лучших книг в мире (во всех жанрах). Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
31.01.2008 - 17:43
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 30.01.2008 Пользователь №: 4759 |
Цитата Из широко известных методов на выбор: - критерий Краскела-Уоллиса, - критерий Данна, - критерий Джонкхиера-Терпстра, - L-критерий Пэйджа, - ранговый критерий Фридмана. Огромное спасибо за совет!!! |
|
1.02.2008 - 00:13
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Не отчаивайтесь!
Первый критерий (Kruskal-Wallis) реализован в самой раскрученной в России программе Statistica. Непараметрический ранговый критерий, он даст ответ - есть ли различия. Если нуль гипотеза отвергнута, там есть Multiple comparisons of mean ranks for all groups. Но, что такое ранг и медиана нужно при этом знать. Это есть в любой книге по статистике. |
|
1.02.2008 - 00:30
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 30.01.2008 Пользователь №: 4760 |
Второе объяснение условия задачи понятнее. В дополнение к ответу Игоря. Я бы посоветовала, перед тем как считать по каждой переменной просмотреть графики типа среднего и доверительного интервала, или, если впрямь сильно скошена форма распределения -- типа box-and-whisker plot, и в качестве категорий по оси абсцисс брать разные условия труда (то что по условию сравнить надо). Можно будет увидеть, насколько направленно (упорядоченно) меняются изучаемые показатели ( может и уместен ранговый корреяционый анализ будет), насколько они «кучкуются». Может можно некоторые градации объединить. Тогда степеней свободы меньше будет.
|
|
1.02.2008 - 00:54
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Автор постера, все же хочет ответить на вопрос достоверны ли различия в 6 группах сравнения по показателю, например, вредности производства. Его интересует не сопряженность или корреляция, а именно различия, поэтому Игорь совершенно прав предлагая для этого соответствующие инструменты (ANOVA Kruskal-Wallis). В результате анализа будет получен средний ранг в каждой группе, его и нужно проиллюстрировать.
|
|
1.02.2008 - 12:33
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 30.01.2008 Пользователь №: 4760 |
Автор постера, все же хочет ответить на вопрос достоверны ли различия в 6 группах сравнения по показателю, например, вредности производства. Его интересует не сопряженность или корреляция, а именно различия, поэтому Игорь совершенно прав предлагая для этого соответствующие инструменты (ANOVA Kruskal-Wallis). В результате анализа будет получен средний ранг в каждой группе, его и нужно проиллюстрировать. Про сопряженность я писала только в первый раз, когда неправильно поняла задачу исследования. Далее я написала в ДОПОЛНЕНИЕ, что можно сделать. Конечно, я за Kruskal-Wallis. Но после нахождения значимых различий начинаются попарные сравнения. А их тут много -- 15 пар. Если их делать U-критерием + поправка Бонферони, то уныло выходит. Возможно для некоторых переменных и инструментарий классической ANOVA с post-hoc`амии подойдут. Возможно, по данной работе большего и не надо. А может, автору хочется шире на вещи взглянуть. Тогда картинки помогут быстрее понять свои данные и решить, нужны ли дополнительные методы исследования. |
|
5.02.2008 - 18:17
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Тут что-то не то. Во-первых данные упорядочены. Соответственно, используя любые варианты дисперсионного анализа (вне зависимости от того - параметрические или непараметрические) будет потереня информация. Если условия тяжести труда меняют от легкого к тяжелому, то необходимо смотреть на тренд, а не просто на различия между группами.
Во вторых, два раза перечитав посты я так и не понял, какой показатель является зависимой переменной. Качественный? Количественный? И, если это количественный показатель (если упорядоченный качественный, то тогда метод выбора - критерий Кохрана-Мантеля-Ханзеля), то как проверялась нормальность распределения. |
|