Здравствуйте уважаемые участники форума!
Интересует следующий вопрос:
какие есть типы анализа дискретных количественных данных?
У меня есть данные по минимальной подавляющей концентрации (МПК) антибиотиков в отношении ряда штаммов микроорганизмов. МПК выражены в дискретных количественных величинах
(они имеют не любые, а определённые значения в мкг/мл, опять же в определённом диапазоне).
Интересуют, в частности, аналоги теста Стьдента для дискретных данных (сравнение двух выборок) и дисперсионного анализа (сравнение трёх и более выборок).
Такие аналоги для дискретных данных вообще существуют?
Спасибо!
аналоги теста Стьдента для дискретных данных (сравнение двух выборок) и дисперсионного анализа (сравнение трёх и более выборок)
Не уверен, что вы правильно понимаете (интерпретируете) термин "дискретный показатель", но скорее всего для вашей задачи подойдет (почти) любой непараметрический тест, начиная с Вилкоксона-Манна-Уитни.
Анализ проверки равенства медиан нескольких выборок - критерий Краскела-Уоллиса.
Согласен с passant.
Есть ремарки по У-М-В и К-У.
1) Эти тесты не на равенство медиан (как маломощный медианный критерий), а на равенство функций распределений.
2) В классической литературе указывается оговорка, что они применимы в случае распределений сходного типа. Однако оба теста являются частными случаями ридит-анализа, который разрабатывался совсем из других теоретических предпосылок и не предполагает сходства распределений.
Также можно организовать сравнение средних техникой Монте-Карло напрямую, безо всяких статкритериев. Я голосую за такой вариант.
Хотел сделать Монте-Карло в R, но оказалось, что выборки-то зависимые! Значит нужны парные критерии или аналоги нужного варианта ДА. Из ресэмплинга здесь просится бустреп для разностей пар с построением доверительных интервалов разности. Это можно сделать средствами PAST. Про то как реализовать здесь Монте-Карло подумаю ещё, т.к. моя заготовка для независимых выборок сюда не пойдёт: нужно менять местами пары внутри отдельных строк...
Предлагаю обсудить различия между двумя последними группами. Данные оказались интересными с точки зрения анализа: они действительно сильно дискретны, заметно различаются средними, но при этом имеют одинаковую медиану. Критерий знаков (не учитывает нулевые разности) показывает высоко статистически значимые различия. Критерий Уилкоксона для разностей пар - тоже (см. скриншот). Но вот я провёл оценку значимости непосредственно средней разности в парах методом Монте-Карло и у меня получилось р=0,125 (одностороннее), что разительно отличается от результатов классики непараметрики. Если народ подтянется в эту ветку форума - могу показать как считал. Также моделирование наглядно показало, что высокая дискретность данных приводит к дискретности распределения разностей, а далее - и к дискретности р-значений. Поскольку я совсем не математик, то оценить степень (не)тривиальности такого эмпирического заключения не могу ))
А что получилось у вас? Ну и самое главное: отличаются ли минимальные подавляющие концентрации этих двух наборов антибиотиков?
Спасибо всем участвующим в обсуждении!
Результаты кластерного анализа показывают, что эта выборка из 128 штаммов гетерогенна (в ней можно выделить кластер штаммов, устойчивых к антибиотику А, относительно устойчивых к нему и чувствительных к нему). При этом, опять же, эта выборка неодинаково реагирует на добавку антибиотика В, а антибиотик С, по-существу, уже не может проявить себя, поскольку комбинация А + Б, для большинства штаммов, "давит" их практически полностью (добавка чего-либо ещё к комбинации А + Б уже попросту не целесообразна).
Возможно, и эти выявленные кластеры нужно анализировать отдельно? А не всю эту гетерогенную выборку сразу?..
Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)