Форум врачей-аспирантов > Как отобразить графически?

Помощь - Поиск - Пользователи - Календарь

Полная версия этой страницы: Как отобразить графически?

Форум врачей-аспирантов > Разделы форума > Медицинская статистика

Blaid

12.09.2013 - 09:15

Здравствуйте!

Вопрос в следующем:

допустим, есть контрольная группа, в которой некоторый количественный показатель равен 0 (точнее, ниже предела обнаружения метода), а в опытной группе (или группах) - больше 0 (например, контроль - 0 мкг/мл, группа 1 - 6 мкг/мл, группа 2 - 11 мкг/мл). Так вот, как бы такие данные корректно отобразить графически?

Буду рад выслушать любые предложения.

Спасибо!

anserovtv

12.09.2013 - 17:03

Мне видится такое решение в среде SPSS
1) перекодировать значения в другую переменную
0 сохранить, , а интервалы преобразовать каждый в одно значение с метками - границами интервалов
2) построить гистограмму частот новой переменной с панелью по столбцам или строкам
В качестве переменной панели использовать группирующую переменную принадлежности к группе.

Другой вариант: применить визуальную или другие категоризации.
Еще вариант применить конструктор диаграмм.
Графических средств очень много, можно начать с панели выбора диаграмм.
Какой вариант лучше - не знаю.Видимо, нужно просто пробовать.
И еще нужно знать , что именно вы хотели бы увидеть или показать.

p2004r

13.09.2013 - 17:20

Цитата(Blaid @ 12.09.2013 - 09:15)

могу только предложить вариант для вот такого случая:

1) есть например достаточно большая популяция в которой мы ищем редкое "заболевание"

2) проведя n тестов мы не выявили ни одного случая. это дает возможность рассчитать нижнюю границу встречаемости искомого заболевания.

3) соответственно вычисленную границу и наносим на график для случая когда ничего не намеряли n раз.

Как это представить для Вашего случая? Наверное если известна вероятность обнаружения (измерения), то можно от числа проведенных попыток намерять показатель вычислить границу ниже которой лежит истинное значение показателя с заданной вероятностью. Её и наносить.

nokh

13.09.2013 - 19:16

Цитата(Blaid @ 12.09.2013 - 12:15)

Здравствуйте!
Вопрос в следующем:
допустим, есть контрольная группа, в которой некоторый количественный показатель равен 0 (точнее, ниже предела обнаружения метода), а в опытной группе (или группах) - больше 0 (например, контроль - 0 мкг/мл, группа 1 - 6 мкг/мл, группа 2 - 11 мкг/мл). Так вот, как бы такие данные корректно отобразить графически?
Буду рад выслушать любые предложения.
Спасибо!

Я бы обычный боксплот дал. В первой группе коробки не будкт, будет только линия медианы на уровне 0, ну и пусть. В таблицу можно и средние (сложности были бы если нондетекты встречались также и в других группах, а так - без проблем), и медианы. Конкретно в вашем случае само сравнений тоже трудностей не вызывает, можно Краскелом-Уоллисом считать.

Blaid

15.09.2013 - 12:12

Спасибо всем ответившим!

Попробую именно последний вариант (nokh). Я сам придумал такой нехитрый вариант: по оси Х - группы (причем 0 - это контроль, т.е. ось Х - это уровень показателя в контрольной группе); ось Y - количественное значение показателя. Или еще одна "гениальная" идея - ось Х оставить как есть, а ось Y просто продолжить ниже 0. Такой вариант на скриншоте из STATISTICA 10 (только там не BOX-PLOTS, а "усы" - доверительный интервал).

anserovtv

15.09.2013 - 12:27

В SPSS в редакторе диаграмм можно добавить опорную линию для оси У/ в качестве контроля/, есть такая команда.
Координату задаете сами. При этом будет построена прямая , параллельная оси Х.

nokh

22.09.2013 - 15:15

Цитата(Blaid @ 15.09.2013 - 15:12)

Ну, вообще-то я советовал совсем другое... Я говорил именно о боксплоте и порядковой статистике. Дело в том, что должно быть соответствие между характеристиками описательной статистики, графиками и методами, которыми данные анализируются. К сожалению, беглый анализ даже наиболее авторитетных статей в ряде областей биологии и медицины, показывает, что таких работ только около 30%, а в отечественных - ещё меньше. В остальных либо ассорти из разных разделов, либо вообще некорректная статистика. Ассорти, это скажем если мы считаем непараметрикой, а на графике даём среднее и ДИ или наоборот, рисуем боксплоты, а сравниваем по Стьюденту или в anova. Не то что так делать нельзя, в некоторых случаях, возможно, может даже нужно, но это нужно и пояснять, чего авторы не делают. Поэтому чаще складывается впечатление, что они не до конца понимают что делают и просто используют готовые блоки из того что делали раньше + уведели в других работах. На мой взгляд в большинстве случаев логично поступать так:

1). Мы находимся на позициях статистики, предполагающей нормальное распределение данных в популяции. Тогда в качестве описательной статистики мы даём средние и ДИ, вычисленные с опорой на t-распредление. Их же приводим на графиках (но не на тех что у вас). Группы сравниваем t-критерием, дисп. анализом. Связи находим корреляцией Пирсона и т.д.
2). Мы находимся на позиции статистики не предполагающей нормального распределения данных, но не хотим огрублять количественные данные до порядковых. Тогда в качестве описательной статистики мы даём средние и какие-либо робастные ДИ, скажем вычисленные с помощью бутстрепа. Их же приводим на графиках. Группы сравниваем методами, не предполагающими норм распредления: перестановочным тестом, робастными вариантами t-критерия и дисп. анализа и т.п. Так же с корреляцией, регрессией и далее.
3). Мы встаём на позицию порядковой статистики, т.е. в подавляющем большинстве случаев просто искусственно отказываемся от своих с трудом добытых данных и заменяем их рангами. С одной стороны это - огрубление данных, но с другой - заметное упрощение анализа, что при не слишком малых выборках практически не сказывается на мощности, а потому приемлемо. Тогда в качестве описательной статистики мы даём боксплоты с медианами, квартилями и минимумом-максимумом в виде усов (обычные усы в 1,5 межквартильных интеравла по Тьюки интерпретируются хуже). Считаю также, что при этом лучше отказываться от от индикации выбросов, т.к. любые методы их обнаружения требуют специального рассмотрения, а это остаётся далеко и глубоко за рамками того, что выдают пакеты по умолчанию.

Что качается вашего рисунка, то он мне не нравится.
Во-первых, сразу бросается в глаза доверительный интервал, уходящий в невозможную здесь область отрицательных значений. Даже неискушённым в статистике людям интуитивно ясно, что здесь что-то не то. Может в остальном они куда безграмотнее нас, но таким рисунком мы сразу даём им повод обвинить нас в недостаточной компетентности и ткнуть в это носом. Зачем?
Во-вторых, и более глубоко. Что вы изображаете на графике: характеристики выборок или результаты дисперсионного анализа? Всё-таки обычно дают первые, а вторые - описывают цифрами. Однако судя по идеально одинаковым ДИ для всех групп у вас на рисунке - результаты дисперсионного анализа и ДИ, вычисленные на основании всего дисперсионного комплекса. Пакет может нарисовать и настоящие исходные (неудачно называемые в Statistica взвешенными), но это нужно задать в результатах anova. И если сравнивали дисп. анализом, то как обрабатывали цензурированные наблюдения типа "менее чем", т.е. "н.ч.м." ("nondetects")? Как ноли? Как значения равные 0,5 нижней границы чувствительности? Это - безграмотно. А грамотный анализ уводит нас далеко в область, которая практически неизвестна большинству исследователей, особенно отечественных. Анализ нондетектов требует искушённости именно в этой области, т.к. методов много, и когда-то лучше одни, когда-то - другие. Чтобы просто осознать степень нашей некомпетентности в этом вопросе, ну и частично заполнить пробел, можно ознакомиться с этим документом:
http://www.epa.gov/osp/hstl/tsc/Singh2006.pdf Дальше поисковиком...
А помимо ДИ, есть варианты всех распространённых анализов, но с цензурированными данными. Есть пакеты, от примитивного ДОСовского Uncensor 4, до монстров типа Scout 2008 (http://www.epa.gov/esd/databases/scout/abstract.htm)? Есть пакеты для R.

Можно долго углубляться в эту область, а можно быстро и просто уйти к порядковой статистике, немного потеряв в мощности. Именно поэтому я посоветовал использовать порядковую описательную статистику и строить боксплоты: чтобы с помощью той же порядковой статистики можно было сравнить группы. Иначе нужно освоить грамотное построение ДИ для данных с нондетектами и спец. варианты анализа таких данных + по ходу изложения ещё и ввести в эту тему читателя.

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.