Анализ дискретных данных, какие есть типы анализа? |
Здравствуйте, гость ( Вход | Регистрация )
Анализ дискретных данных, какие есть типы анализа? |
23.09.2019 - 12:26
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 36 Регистрация: 27.08.2012 Пользователь №: 24128 |
Здравствуйте уважаемые участники форума!
Интересует следующий вопрос: какие есть типы анализа дискретных количественных данных? У меня есть данные по минимальной подавляющей концентрации (МПК) антибиотиков в отношении ряда штаммов микроорганизмов. МПК выражены в дискретных количественных величинах (они имеют не любые, а определённые значения в мкг/мл, опять же в определённом диапазоне). Интересуют, в частности, аналоги теста Стьдента для дискретных данных (сравнение двух выборок) и дисперсионного анализа (сравнение трёх и более выборок). Такие аналоги для дискретных данных вообще существуют? Спасибо! |
|
23.09.2019 - 18:05
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
аналоги теста Стьдента для дискретных данных (сравнение двух выборок) и дисперсионного анализа (сравнение трёх и более выборок)
Не уверен, что вы правильно понимаете (интерпретируете) термин "дискретный показатель", но скорее всего для вашей задачи подойдет (почти) любой непараметрический тест, начиная с Вилкоксона-Манна-Уитни. Анализ проверки равенства медиан нескольких выборок - критерий Краскела-Уоллиса. Сообщение отредактировал passant - 23.09.2019 - 18:05 |
|
23.09.2019 - 19:24
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Согласен с passant.
Есть ремарки по У-М-В и К-У. 1) Эти тесты не на равенство медиан (как маломощный медианный критерий), а на равенство функций распределений. 2) В классической литературе указывается оговорка, что они применимы в случае распределений сходного типа. Однако оба теста являются частными случаями ридит-анализа, который разрабатывался совсем из других теоретических предпосылок и не предполагает сходства распределений. Также можно организовать сравнение средних техникой Монте-Карло напрямую, безо всяких статкритериев. Я голосую за такой вариант. Сообщение отредактировал nokh - 23.09.2019 - 20:56 |
|
24.09.2019 - 21:55
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Хотел сделать Монте-Карло в R, но оказалось, что выборки-то зависимые! Значит нужны парные критерии или аналоги нужного варианта ДА. Из ресэмплинга здесь просится бустреп для разностей пар с построением доверительных интервалов разности. Это можно сделать средствами PAST. Про то как реализовать здесь Монте-Карло подумаю ещё, т.к. моя заготовка для независимых выборок сюда не пойдёт: нужно менять местами пары внутри отдельных строк...
Сообщение отредактировал nokh - 24.09.2019 - 22:03 |
|
28.09.2019 - 00:49
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Предлагаю обсудить различия между двумя последними группами. Данные оказались интересными с точки зрения анализа: они действительно сильно дискретны, заметно различаются средними, но при этом имеют одинаковую медиану. Критерий знаков (не учитывает нулевые разности) показывает высоко статистически значимые различия. Критерий Уилкоксона для разностей пар - тоже (см. скриншот). Но вот я провёл оценку значимости непосредственно средней разности в парах методом Монте-Карло и у меня получилось р=0,125 (одностороннее), что разительно отличается от результатов классики непараметрики. Если народ подтянется в эту ветку форума - могу показать как считал. Также моделирование наглядно показало, что высокая дискретность данных приводит к дискретности распределения разностей, а далее - и к дискретности р-значений. Поскольку я совсем не математик, то оценить степень (не)тривиальности такого эмпирического заключения не могу ))
А что получилось у вас? Ну и самое главное: отличаются ли минимальные подавляющие концентрации этих двух наборов антибиотиков? Сообщение отредактировал nokh - 28.09.2019 - 06:17 |
|
28.09.2019 - 15:12
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Также моделирование наглядно показало, что высокая дискретность данных приводит к дискретности распределения разностей, а далее - и к дискретности р-значений. Поскольку я совсем не математик, то оценить степень (не)тривиальности такого эмпирического заключения не могу )) Для непараметрики это - тривиальная тривиальщина . |
|
29.09.2019 - 13:33
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 36 Регистрация: 27.08.2012 Пользователь №: 24128 |
Спасибо всем участвующим в обсуждении!
Результаты кластерного анализа показывают, что эта выборка из 128 штаммов гетерогенна (в ней можно выделить кластер штаммов, устойчивых к антибиотику А, относительно устойчивых к нему и чувствительных к нему). При этом, опять же, эта выборка неодинаково реагирует на добавку антибиотика В, а антибиотик С, по-существу, уже не может проявить себя, поскольку комбинация А + Б, для большинства штаммов, "давит" их практически полностью (добавка чего-либо ещё к комбинации А + Б уже попросту не целесообразна). Возможно, и эти выявленные кластеры нужно анализировать отдельно? А не всю эту гетерогенную выборку сразу?.. |
|