Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> Анализ данных в баллах
Адам
сообщение 30.06.2011 - 13:29
Сообщение #1





Группа: Пользователи
Сообщений: 27
Регистрация: 28.06.2011
Пользователь №: 23257



Уважаемые коллеги! Кто-нибудь сталкивался с анализом полученных данных в баллах. Имеются две группы нужно сравнить статистическую разницу между ними на основании методики в баллах от 1 до 4. Использование какого статистического метода будет правильным, где можно посмотреть информацию о статистике данных представленных в баллах и не имеющих промежуточные значения.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 30.06.2011 - 15:36
Сообщение #2





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Адам @ 30.06.2011 - 16:29) *
Уважаемые коллеги! Кто-нибудь сталкивался с анализом полученных данных в баллах. Имеются две группы нужно сравнить статистическую разницу между ними на основании методики в баллах от 1 до 4. Использование какого статистического метода будет правильным, где можно посмотреть информацию о статистике данных представленных в баллах и не имеющих промежуточные значения.

Порядковые признаки можно анализировать и как количественные (измерения), и как качественные (категории). Но более естественным представляется всё-таки их сравнение методами порядковой статистики. По поводу анализа как количественных - существуют авторитетные работы, РЕКОМЕНДУЮЩИЕ переходить от измерений к рангам даже в случае классических параметрических техник, таких как дисперсионный анализ - типа для повышения устойчивости оценок. И хотя научное сообщество уже лет 30 не спешит прислушиваться к этим рекомендациям такое мнение существует и на него можно сослаться если прижмёт. По поводу анализа как категорий - нужно учитывать что категории не номинальные, а упорядоченные. Учёт упорядоченности при анализе таблиц сопряжённости требует определённой искушённости, это не хи-квадрат и вручную считать очень муторно, а программ которые это делают - единицы и Statistica не входит в их число.
На этом фоне методы порядковой статистики - то что нужно. Хотя многие из них разрабатывались для непрерывных распределений, на практике эта непрерывность никогда не выполняется. Строго говоря она не выполняется даже для классических измерений в силу несовершенства приборов и округления результатов. Считайте, что у вас очень маленький объект и очень грубая линейка - вот и получится шкала из 4 значений. Всё-таки когда речь заходит о баллах, причём в любой шкале (1-3, 1-5, 1-10 и др.), мы относимся к ним даже не как к порядковым данным, а именно как к измерениям и представляем результат в виде среднего балла. А как к упорядоченным категориям мы относимся к ним куда реже (ну, например, когда говорим, что доля сдавших предмет на 5 баллов составила столько-то %).
Короче, считайте по Манну - Уитни и не парьтесь. Источников, рекомендующих его для порядковых данных - полно, благо не Ребровой единой..., есть что почитать. Более того, этот критерий входит в набор для анализа не то что баллов, а вообще упорядоченных категорий в серьёзном и авторитетном пакете StatXact.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Адам
сообщение 30.06.2011 - 17:11
Сообщение #3





Группа: Пользователи
Сообщений: 27
Регистрация: 28.06.2011
Пользователь №: 23257



nokh, спасибо за ответ, при использовании Манна - Уитни возникает вопрос, изложенный в предыдущем моем сообщении по поводу выбора критерия достоверности, Р отличаются кардинально, но выбрать один из трех вариантов обоснованно не могу
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 30.06.2011 - 18:57
Сообщение #4





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Обсуждали здесь: http://forum.disser.ru/index.php?showtopic...post&p=4800
Если связок (одинаковых значений в той и другой выборках) много - надо делать поправку на связки (второе значение Р), иначе критерий становится консервативным (благоприятствует нулевой гипотезе), т.е. Р будет больше. Если данных мало - <8 в каждой выборке - по Заксу (Закс Л. Статистическое оценивание - скачайте, старая но хорошая книга), или <20 по хелпу к программе - использовать аппроксимацию U-статистики нормальным распределением некорректно, нужно брать третье Р, которое однако не учитывает связки и т.о. завышено. У меня чаще количественные показатели - значения почти не повторяются в той и другой выборках, а сами выборки малы, поэтому когда раньше считал в Statistica - брал третье значение Р. Т.к. у вас все значения - это только цифры 1, 2, 3 или 4 которые повторяются в обеих выборках - связок будет очень много. Если выборки большие - используйте второе значение Р, оно будет меньше и правильнее.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Адам
сообщение 30.06.2011 - 20:01
Сообщение #5





Группа: Пользователи
Сообщений: 27
Регистрация: 28.06.2011
Пользователь №: 23257



в каждой группе по 20 повторений, у администратора прошу прощения за повторение рисунка


вопрос видите принципиальный, какое значение выбрать т.к. у меня эта таблица не единственная и там таже картина. Может быть рассчитать в другом статистическом пакете?

Сообщение отредактировал Адам - 30.06.2011 - 20:02
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Адам
сообщение 1.07.2011 - 05:44
Сообщение #6





Группа: Пользователи
Сообщений: 27
Регистрация: 28.06.2011
Пользователь №: 23257



может быть для этих целей нужно использовать анализ корреляций, например тау Кендалла?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 1.07.2011 - 10:08
Сообщение #7





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Вот как раз с цели исследования и начните работу над анализом данных, а не с программы, скриншот которой вы приводите. Этой версией программы вообще нельзя пользоваться, и не только потому, что это пиратская копи. Вас не насторожило, что критерий Манна Уитни U критерий (Перо делаю).
Из ваших постов ясно не многое, нужно иметь больше информации о том, как спланировано исследование, что и как вы измеряли и что вам нужно сравнить. В последнем посте вы уже про анализ корреляций спрашиваете, т.е. совсем запутались, и ответ nokh не поняли.

Судя по данным вам нужно сравнить характер динамики, который представлен переменной чувствительность в двух группах, вот только что значит 20 повторений, не понятно. А по сему, классический вопрос ученого совета, а что у вас является предметом исследования, а что объектом исследования.

По поводу оценок в баллах. Сегодня много медицинских работ, в которых клинические признаки формализуются в виде полуколичественных или ранговых оценок, которые являются упорядоченными категориями. Например, степень тяжести болезни - 1,2, 3 и 4 стадии кератоконуса. При сравнении двух групп по степени тяжести может быть использован критерий М-У, и если нулевая гипотеза отклоняется, то пишут, что в одной из групп больше больных с более тяжелыми стадиями болезни. При этом иллюстрируют различия средними рангами, а не средними арифметическими. Аналогично, начальная (1), незрелая (2), зрелая катаракта (3) не может превратиться в балловую оценку, со средним 2, если в группе есть 1 и 3.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Адам
сообщение 1.07.2011 - 11:05
Сообщение #8





Группа: Пользователи
Сообщений: 27
Регистрация: 28.06.2011
Пользователь №: 23257



DrgLena спасибо за ответ! Цель исследования - сравнить разницу в оперении двух групп птиц, отбираемых по определенной методике, на основании которой они делятся на 2 группы, обозначенные как + и - . Оценка количества перьев в баллах 1 балл нет перьев, 4 балла максимальное количество. Задача выявить различия между этими группами по количеству перьев.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 1.07.2011 - 16:58
Сообщение #9





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



В шкале баллов операция деления не определена. Следовательно, т.н. "средний балл" - некорректное понятие. Не допускайте ошибки. Используйте медиану.

Для истинно количественных признаков округление результатов измерения не изменяет тип признака и не превращает количественную величину в порядковую (ибо различие между шкалами определяется прежде всего допустимостью в той или иной шкале определенных арифметических операций), поэтому приведенные выше рассуждения на эту тему не считаю верными. Не нужно вводить в заблуждение менее опытных собеседников.

Сообщение отредактировал Игорь - 1.07.2011 - 17:03


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Адам
сообщение 1.07.2011 - 18:07
Сообщение #10





Группа: Пользователи
Сообщений: 27
Регистрация: 28.06.2011
Пользователь №: 23257



Спасибо Игорь, из Вашего сообщения я понял, что можно использовать Манна-Уитни, естественно данные будут представлены в виде медиан и квартилей, но какое из Р выбрать в данном случае к сожалению до сих пор понять не могу
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 1.07.2011 - 20:24
Сообщение #11





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Адам @ 1.07.2011 - 18:07) *
Спасибо Игорь, из Вашего сообщения я понял, что можно использовать Манна-Уитни, естественно данные будут представлены в виде медиан и квартилей, но какое из Р выбрать в данном случае к сожалению до сих пор понять не могу


А нельзя тупо пересчитать количество перьев у каждой птицы и работать с этими значениями, вместо того, чтобы усложнять себе жизнь, пытаясь из трех значений достигаемого уровня значимости выбрать тот, который больше нравится?

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Адам
сообщение 1.07.2011 - 21:22
Сообщение #12





Группа: Пользователи
Сообщений: 27
Регистрация: 28.06.2011
Пользователь №: 23257



нельзя и не возможно
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 1.07.2011 - 22:50
Сообщение #13





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Адам @ 1.07.2011 - 21:22) *
нельзя и не возможно


Тогда, похоже, надо исходить из того, что скорректирован ("adjusted") критерий может быть только на обилие связок, и получается, что ориентиоваться надо на второе значение р.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Адам
сообщение 2.07.2011 - 05:38
Сообщение #14





Группа: Пользователи
Сообщений: 27
Регистрация: 28.06.2011
Пользователь №: 23257



Спасибо, 100$!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 2.07.2011 - 18:52
Сообщение #15





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(DrgLena @ 1.07.2011 - 13:08) *
По поводу оценок в баллах. Сегодня много медицинских работ, в которых клинические признаки формализуются в виде полуколичественных или ранговых оценок, которые являются упорядоченными категориями... При этом иллюстрируют различия средними рангами, а не средними арифметическими...

Цитата(Игорь @ 1.07.2011 - 19:58) *
В шкале баллов операция деления не определена. Следовательно, т.н. "средний балл" - некорректное понятие. Не допускайте ошибки. Используйте медиану...

И чем же всем мои баллы не понравились? Может мы говорим о разных баллах? Я могу материализовать виртуальные баллы и больному, поступившему с тяжестью по шкале APACHE II в 8 баллов, выдать 8 жетонов, или нарисовать в карточке 8 галочек. Другому - два (две). Это будут вполне счётные признаки (как, впрочем, и виртуальные). Также могу для каждого из них подсчитать сколько лет он прожил до сего дня и сколько условных единиц, именуемых сантиметрами, укладывается в его росте - чем не счётные? Так почему же для возраста и роста можно рассчитать средние значения, а для баллов ? нет?
С истинно порядковыми признаками, видимо, сложнее. Но под наблюдаемой порядковой шкалой скрыто какое-то распределение, принимающее на выходе дискретные значения. А насколько я понимаю, для известных распределений существуют функции, связывающие исходные шкалы с порядковыми. На этом, в частности основан критерий Ван-дер-Вардена и Regression on order statistics (ROS) методы восстановления значений усечённых распределений.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему