Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Дисперсия в порядковой шкале
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
wardoc
Добрый день, уважаемые.

У меня ситуация следующая: есть показатель, измеренный в порядковой шкале. Это морфологическая харакетристика нейроцитов при окраске по Нисслю (гипохромные, нормохромные, гиперхромные). Необходимо расчитать для него дисперсию. Как это сделать для порядковой шкалы?
nokh
Ваши данные представляют собой упорядоченные категории. Т.е. дисперсию для них нужно находить по формуле для частот полиномиального распределения. Хотя зачем это нужно? - она есть производное от объема выборки... Полагаю, что конечная ваша цель - не в том, чтобы оценить дисперсию.
плав
Добавлю, что любой статистический показатель должен нести смысловую нагрузку. Дисперсия - показатель разброса данных вокруг среднего. Что в данном случае является средним? Нормохромность? А как далеко от нее отстоит гиперхромность? Для оценки дисперсии обычно вопрос присвоения ранговых номеров показателям порядковой шкалы является одним из наиболее дебатируемых. Поэтому, как указывает nokh имеет смысл переформулировать вопрос в пользу того, что же интересует в конечном счете.
Игорь
Цитата(wardoc @ 29.07.2008 - 05:51) *
... есть показатель, измеренный в порядковой шкале. Это морфологическая харакетристика нейроцитов при окраске по Нисслю (гипохромные, нормохромные, гиперхромные). Необходимо расчитать для него дисперсию. Как это сделать для порядковой шкалы?


Пример мне напоминает не порядковую, а номинальную шкалу с тремя градациями. Нет?

Далее лучше цитату из хорошего источника:
"Как правило, для переменных, относящихся к интервальной шкале и подчиняющихся нормальному распределению, в качестве основной характеристики используют среднее значение, а в качестве меры разброса - стандартное отклонение или стандартную ошибку. Для порядковых или интервальных переменных, не подчиняющихся нормальному распределению, - соответственно медиану или первый и третий квартили. Для переменных относящихся к номинальной шкале, нельзя дать других значимых характеристик кроме моды."

Источник: http://www.realcoding.net/teach/SPSS/Glava%206/Index3.html

Единственное, что хочется добавить, разница верхней (в терминологии источника - третьего) и нижней (первого) квартилей (кстати, в женском роде все же благозвучнее) дает такую характеристику разброса для количественной или порядковой случайной величины, как межквартильный размах.
wardoc
Всем спаcибо!
плав
Цитата(Игорь @ 30.07.2008 - 19:21) *
Пример мне напоминает не порядковую, а номинальную шкалу с тремя градациями. Нет?

Далее лучше цитату из хорошего источника:
"Как правило, для переменных, относящихся к интервальной шкале и подчиняющихся нормальному распределению, в качестве основной характеристики используют среднее значение, а в качестве меры разброса - стандартное отклонение или стандартную ошибку. Для порядковых или интервальных переменных, не подчиняющихся нормальному распределению, - соответственно медиану или первый и третий квартили. Для переменных относящихся к номинальной шкале, нельзя дать других значимых характеристик кроме моды."

Источник: http://www.realcoding.net/teach/SPSS/Glava%206/Index3.html

Единственное, что хочется добавить, разница верхней (в терминологии источника - третьего) и нижней (первого) квартилей (кстати, в женском роде все же благозвучнее) дает такую характеристику разброса для количественной или порядковой случайной величины, как межквартильный размах.

Это, все-таки, скорее порядковая (ординальная) переменная (точнее, переменная, измеренная при помощи порядковой шкалы). Дело в том, что сама переменная отражает степень окраски и поэтому возникает естественный порядок. Делать последовательность, например, гиперхромные, гипохромные, нормохроные будет означать потерю логики. Поскольку порядок есть, эта информация может быть использована и поэтому лучше использовать методы анализа, предназначенные для порядковых переменных, поскольку использование номинальной шкалы приведет к потере информации.
hongma
Здравствуйте.
Формально можно, конечно, сделать, например, так:
Присвоить гипохромия = 0, нормохромия=1, гиперхромия =2. И считать среднее и дисперсию. Но возникает вопрос, а зачем это все надо? Если вы хотите сравнить 2 группы по соотношению этих видов клеток, то может проще сравнивать по хи-критерию частоты этих типов? Если вы хотите смотреть корреляцию с каким-то фактором, скажем, дали 2 дозы препарата и смотрим контроль, доза 1 и доза 2 - есть зависимость или нет, то тогда такой подход оправдан. Но тогда среднее и дисперсия сами по себе не нужны. Скажите подробнее, что вам нужно узнать.
Игорь
Цитата(hongma @ 9.08.2008 - 12:56) *
Формально можно, конечно, сделать, например, так:
Присвоить гипохромия = 0, нормохромия=1, гиперхромия =2. И считать среднее и дисперсию.

Ошибочный совет. Категорически не согласен. Автору поста перед тем, как давать подобные советы, предлагается изучить шкалы измерения - это самые основы прикладного анализа данных.
Цитата(hongma @ 9.08.2008 - 12:56) *
Но возникает вопрос, а зачем это все надо? Если вы хотите сравнить 2 группы по соотношению этих видов клеток, то может проще сравнивать по хи-критерию частоты этих типов?

К сожалению, не проще. У критериев типа хи-квадрат есть определенные ограничения. В частности, авторы дают рекомендации по пределу малости частот в ячейках таблицы. Это значения 4 или 5. Существуют и объективные критерии применимости [аппроксимации] хи-квадрат - так называемые диагностики. Некоторые компьютерные программы данные параметры считают.

Поэтому исследователям следует знать, что существуют методы, позволяющие обойти указанные ограничения. Это - так называемые точные критерии. Для таблицы 2 х 2 - это широко известный точный метод Фишера (ТМФ). Для бОльших таблиц - это расширение ТМФ, известное под названием критерия Фримана-Холтона.

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.