Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Анализ дискретных данных

Автор: Blaid 23.09.2019 - 12:26

Здравствуйте уважаемые участники форума!

Интересует следующий вопрос:

какие есть типы анализа дискретных количественных данных?

У меня есть данные по минимальной подавляющей концентрации (МПК) антибиотиков в отношении ряда штаммов микроорганизмов. МПК выражены в дискретных количественных величинах
(они имеют не любые, а определённые значения в мкг/мл, опять же в определённом диапазоне).
Интересуют, в частности, аналоги теста Стьдента для дискретных данных (сравнение двух выборок) и дисперсионного анализа (сравнение трёх и более выборок).
Такие аналоги для дискретных данных вообще существуют?

Спасибо!

Автор: passant 23.09.2019 - 18:05

аналоги теста Стьдента для дискретных данных (сравнение двух выборок) и дисперсионного анализа (сравнение трёх и более выборок)
Не уверен, что вы правильно понимаете (интерпретируете) термин "дискретный показатель", но скорее всего для вашей задачи подойдет (почти) любой непараметрический тест, начиная с Вилкоксона-Манна-Уитни.
Анализ проверки равенства медиан нескольких выборок - критерий Краскела-Уоллиса.

Автор: nokh 23.09.2019 - 19:24

Согласен с passant.
Есть ремарки по У-М-В и К-У.
1) Эти тесты не на равенство медиан (как маломощный медианный критерий), а на равенство функций распределений.
2) В классической литературе указывается оговорка, что они применимы в случае распределений сходного типа. Однако оба теста являются частными случаями ридит-анализа, который разрабатывался совсем из других теоретических предпосылок и не предполагает сходства распределений.

Также можно организовать сравнение средних техникой Монте-Карло напрямую, безо всяких статкритериев. Я голосую за такой вариант.

Автор: nokh 24.09.2019 - 21:55

Хотел сделать Монте-Карло в R, но оказалось, что выборки-то зависимые! Значит нужны парные критерии или аналоги нужного варианта ДА. Из ресэмплинга здесь просится бустреп для разностей пар с построением доверительных интервалов разности. Это можно сделать средствами PAST. Про то как реализовать здесь Монте-Карло подумаю ещё, т.к. моя заготовка для независимых выборок сюда не пойдёт: нужно менять местами пары внутри отдельных строк...

Автор: nokh 28.09.2019 - 00:49

Предлагаю обсудить различия между двумя последними группами. Данные оказались интересными с точки зрения анализа: они действительно сильно дискретны, заметно различаются средними, но при этом имеют одинаковую медиану. Критерий знаков (не учитывает нулевые разности) показывает высоко статистически значимые различия. Критерий Уилкоксона для разностей пар - тоже (см. скриншот). Но вот я провёл оценку значимости непосредственно средней разности в парах методом Монте-Карло и у меня получилось р=0,125 (одностороннее), что разительно отличается от результатов классики непараметрики. Если народ подтянется в эту ветку форума - могу показать как считал. Также моделирование наглядно показало, что высокая дискретность данных приводит к дискретности распределения разностей, а далее - и к дискретности р-значений. Поскольку я совсем не математик, то оценить степень (не)тривиальности такого эмпирического заключения не могу pardon.gif ))

А что получилось у вас? Ну и самое главное: отличаются ли минимальные подавляющие концентрации этих двух наборов антибиотиков?

 

Автор: 100$ 28.09.2019 - 15:12

Цитата(nokh @ 28.09.2019 - 00:49) *
Также моделирование наглядно показало, что высокая дискретность данных приводит к дискретности распределения разностей, а далее - и к дискретности р-значений. Поскольку я совсем не математик, то оценить степень (не)тривиальности такого эмпирического заключения не могу pardon.gif ))


Для непараметрики это - тривиальная тривиальщина .

Автор: Blaid 29.09.2019 - 13:33

Спасибо всем участвующим в обсуждении!

Результаты кластерного анализа показывают, что эта выборка из 128 штаммов гетерогенна (в ней можно выделить кластер штаммов, устойчивых к антибиотику А, относительно устойчивых к нему и чувствительных к нему). При этом, опять же, эта выборка неодинаково реагирует на добавку антибиотика В, а антибиотик С, по-существу, уже не может проявить себя, поскольку комбинация А + Б, для большинства штаммов, "давит" их практически полностью (добавка чего-либо ещё к комбинации А + Б уже попросту не целесообразна).
Возможно, и эти выявленные кластеры нужно анализировать отдельно? А не всю эту гетерогенную выборку сразу?..

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)