Анализ данных в баллах |
Здравствуйте, гость ( Вход | Регистрация )
Анализ данных в баллах |
30.06.2011 - 13:29
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 27 Регистрация: 28.06.2011 Пользователь №: 23257 |
Уважаемые коллеги! Кто-нибудь сталкивался с анализом полученных данных в баллах. Имеются две группы нужно сравнить статистическую разницу между ними на основании методики в баллах от 1 до 4. Использование какого статистического метода будет правильным, где можно посмотреть информацию о статистике данных представленных в баллах и не имеющих промежуточные значения.
|
|
30.06.2011 - 15:36
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Уважаемые коллеги! Кто-нибудь сталкивался с анализом полученных данных в баллах. Имеются две группы нужно сравнить статистическую разницу между ними на основании методики в баллах от 1 до 4. Использование какого статистического метода будет правильным, где можно посмотреть информацию о статистике данных представленных в баллах и не имеющих промежуточные значения. Порядковые признаки можно анализировать и как количественные (измерения), и как качественные (категории). Но более естественным представляется всё-таки их сравнение методами порядковой статистики. По поводу анализа как количественных - существуют авторитетные работы, РЕКОМЕНДУЮЩИЕ переходить от измерений к рангам даже в случае классических параметрических техник, таких как дисперсионный анализ - типа для повышения устойчивости оценок. И хотя научное сообщество уже лет 30 не спешит прислушиваться к этим рекомендациям такое мнение существует и на него можно сослаться если прижмёт. По поводу анализа как категорий - нужно учитывать что категории не номинальные, а упорядоченные. Учёт упорядоченности при анализе таблиц сопряжённости требует определённой искушённости, это не хи-квадрат и вручную считать очень муторно, а программ которые это делают - единицы и Statistica не входит в их число. На этом фоне методы порядковой статистики - то что нужно. Хотя многие из них разрабатывались для непрерывных распределений, на практике эта непрерывность никогда не выполняется. Строго говоря она не выполняется даже для классических измерений в силу несовершенства приборов и округления результатов. Считайте, что у вас очень маленький объект и очень грубая линейка - вот и получится шкала из 4 значений. Всё-таки когда речь заходит о баллах, причём в любой шкале (1-3, 1-5, 1-10 и др.), мы относимся к ним даже не как к порядковым данным, а именно как к измерениям и представляем результат в виде среднего балла. А как к упорядоченным категориям мы относимся к ним куда реже (ну, например, когда говорим, что доля сдавших предмет на 5 баллов составила столько-то %). Короче, считайте по Манну - Уитни и не парьтесь. Источников, рекомендующих его для порядковых данных - полно, благо не Ребровой единой..., есть что почитать. Более того, этот критерий входит в набор для анализа не то что баллов, а вообще упорядоченных категорий в серьёзном и авторитетном пакете StatXact. |
|
30.06.2011 - 17:11
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 27 Регистрация: 28.06.2011 Пользователь №: 23257 |
nokh, спасибо за ответ, при использовании Манна - Уитни возникает вопрос, изложенный в предыдущем моем сообщении по поводу выбора критерия достоверности, Р отличаются кардинально, но выбрать один из трех вариантов обоснованно не могу
|
|
30.06.2011 - 18:57
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Обсуждали здесь: http://forum.disser.ru/index.php?showtopic...post&p=4800
Если связок (одинаковых значений в той и другой выборках) много - надо делать поправку на связки (второе значение Р), иначе критерий становится консервативным (благоприятствует нулевой гипотезе), т.е. Р будет больше. Если данных мало - <8 в каждой выборке - по Заксу (Закс Л. Статистическое оценивание - скачайте, старая но хорошая книга), или <20 по хелпу к программе - использовать аппроксимацию U-статистики нормальным распределением некорректно, нужно брать третье Р, которое однако не учитывает связки и т.о. завышено. У меня чаще количественные показатели - значения почти не повторяются в той и другой выборках, а сами выборки малы, поэтому когда раньше считал в Statistica - брал третье значение Р. Т.к. у вас все значения - это только цифры 1, 2, 3 или 4 которые повторяются в обеих выборках - связок будет очень много. Если выборки большие - используйте второе значение Р, оно будет меньше и правильнее. |
|
30.06.2011 - 20:01
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 27 Регистрация: 28.06.2011 Пользователь №: 23257 |
в каждой группе по 20 повторений, у администратора прошу прощения за повторение рисунка
вопрос видите принципиальный, какое значение выбрать т.к. у меня эта таблица не единственная и там таже картина. Может быть рассчитать в другом статистическом пакете? Сообщение отредактировал Адам - 30.06.2011 - 20:02 |
|
1.07.2011 - 05:44
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 27 Регистрация: 28.06.2011 Пользователь №: 23257 |
может быть для этих целей нужно использовать анализ корреляций, например тау Кендалла?
|
|
1.07.2011 - 10:08
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Вот как раз с цели исследования и начните работу над анализом данных, а не с программы, скриншот которой вы приводите. Этой версией программы вообще нельзя пользоваться, и не только потому, что это пиратская копи. Вас не насторожило, что критерий Манна Уитни U критерий (Перо делаю).
Из ваших постов ясно не многое, нужно иметь больше информации о том, как спланировано исследование, что и как вы измеряли и что вам нужно сравнить. В последнем посте вы уже про анализ корреляций спрашиваете, т.е. совсем запутались, и ответ nokh не поняли. Судя по данным вам нужно сравнить характер динамики, который представлен переменной чувствительность в двух группах, вот только что значит 20 повторений, не понятно. А по сему, классический вопрос ученого совета, а что у вас является предметом исследования, а что объектом исследования. По поводу оценок в баллах. Сегодня много медицинских работ, в которых клинические признаки формализуются в виде полуколичественных или ранговых оценок, которые являются упорядоченными категориями. Например, степень тяжести болезни - 1,2, 3 и 4 стадии кератоконуса. При сравнении двух групп по степени тяжести может быть использован критерий М-У, и если нулевая гипотеза отклоняется, то пишут, что в одной из групп больше больных с более тяжелыми стадиями болезни. При этом иллюстрируют различия средними рангами, а не средними арифметическими. Аналогично, начальная (1), незрелая (2), зрелая катаракта (3) не может превратиться в балловую оценку, со средним 2, если в группе есть 1 и 3. |
|
1.07.2011 - 11:05
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 27 Регистрация: 28.06.2011 Пользователь №: 23257 |
DrgLena спасибо за ответ! Цель исследования - сравнить разницу в оперении двух групп птиц, отбираемых по определенной методике, на основании которой они делятся на 2 группы, обозначенные как + и - . Оценка количества перьев в баллах 1 балл нет перьев, 4 балла максимальное количество. Задача выявить различия между этими группами по количеству перьев.
|
|
1.07.2011 - 16:58
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
В шкале баллов операция деления не определена. Следовательно, т.н. "средний балл" - некорректное понятие. Не допускайте ошибки. Используйте медиану.
Для истинно количественных признаков округление результатов измерения не изменяет тип признака и не превращает количественную величину в порядковую (ибо различие между шкалами определяется прежде всего допустимостью в той или иной шкале определенных арифметических операций), поэтому приведенные выше рассуждения на эту тему не считаю верными. Не нужно вводить в заблуждение менее опытных собеседников. Сообщение отредактировал Игорь - 1.07.2011 - 17:03 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
1.07.2011 - 18:07
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 27 Регистрация: 28.06.2011 Пользователь №: 23257 |
Спасибо Игорь, из Вашего сообщения я понял, что можно использовать Манна-Уитни, естественно данные будут представлены в виде медиан и квартилей, но какое из Р выбрать в данном случае к сожалению до сих пор понять не могу
|
|
1.07.2011 - 20:24
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Спасибо Игорь, из Вашего сообщения я понял, что можно использовать Манна-Уитни, естественно данные будут представлены в виде медиан и квартилей, но какое из Р выбрать в данном случае к сожалению до сих пор понять не могу А нельзя тупо пересчитать количество перьев у каждой птицы и работать с этими значениями, вместо того, чтобы усложнять себе жизнь, пытаясь из трех значений достигаемого уровня значимости выбрать тот, который больше нравится? |
|
1.07.2011 - 21:22
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 27 Регистрация: 28.06.2011 Пользователь №: 23257 |
нельзя и не возможно
|
|
1.07.2011 - 22:50
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
|
|
2.07.2011 - 05:38
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 27 Регистрация: 28.06.2011 Пользователь №: 23257 |
Спасибо, 100$!
|
|
2.07.2011 - 18:52
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
По поводу оценок в баллах. Сегодня много медицинских работ, в которых клинические признаки формализуются в виде полуколичественных или ранговых оценок, которые являются упорядоченными категориями... При этом иллюстрируют различия средними рангами, а не средними арифметическими... В шкале баллов операция деления не определена. Следовательно, т.н. "средний балл" - некорректное понятие. Не допускайте ошибки. Используйте медиану... И чем же всем мои баллы не понравились? Может мы говорим о разных баллах? Я могу материализовать виртуальные баллы и больному, поступившему с тяжестью по шкале APACHE II в 8 баллов, выдать 8 жетонов, или нарисовать в карточке 8 галочек. Другому - два (две). Это будут вполне счётные признаки (как, впрочем, и виртуальные). Также могу для каждого из них подсчитать сколько лет он прожил до сего дня и сколько условных единиц, именуемых сантиметрами, укладывается в его росте - чем не счётные? Так почему же для возраста и роста можно рассчитать средние значения, а для баллов ? нет? С истинно порядковыми признаками, видимо, сложнее. Но под наблюдаемой порядковой шкалой скрыто какое-то распределение, принимающее на выходе дискретные значения. А насколько я понимаю, для известных распределений существуют функции, связывающие исходные шкалы с порядковыми. На этом, в частности основан критерий Ван-дер-Вардена и Regression on order statistics (ROS) методы восстановления значений усечённых распределений. |
|