Цитата(Acetylka @ 28.06.2016 - 00:16)

Доброго времени суток!
Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось.
Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть.
Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...)
Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий?
Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное.
Точный метод Фишера (ТМФ) разработан в предположении гипергеометрического распределения данных и его использование для анализа биномиально распределённых данных
методологически некорректно. Для вычислительных возможностей почти столетней давности ТМФ был единственным способом анализа слабонасыщенных таблиц сопряжённости, поэтому на такую некорректность долгое время закрывали глаза, а потом большинство и вовсе забыло. А если постигать статистику по отечественным источникам, то и не знали, и забыли, и знать не хотят, и будут стоять на своём до конца.
Для анализа ваших данных нужен расчёт р-значения на основе биномиального распределения (exact permutation test, лучший пакет здесь - StatXact от Cytel Studio), хуже, но приемлемо - рандомизационный тест Монте-Карло, который генерирует не все возможные таблицы с данными краевыми частотами, а очень большое число случайных таких таблиц. Такой тест можно сделать в пакете PAST:
http://folk.uio.no/ohammer/past/ Набить цифры в 4 ячейки, выделить, Путь: Univariate - Contingency table. Смотреть MonteCarlo p, а количество перевыборок увеличить в Permutation так, чтобы после Recompute значение MonteCarlo p не менялось в 4-5 знаке (9999 или 999999 или ещё больше).
Если находиться на позициях частотного (фриквентистского) подхода к проверке гипотез, то способ который предлагает p2004r обладает меньшей мощностью, т.к. 95%-ный ДИ строится для каждой доли отдельно, т.е. оба раза при построении ДИ половина имеющейся информации не используется. Лучше считать ДИ разности, чтобы задействовать в расчёте сразу обе частоты и не терять в мощности при получении значения p. Если же находиться в оппозиции к частотному подходу, то сравнение через сопоставление ДИ можно рассматривать как лишённый внутреннего противоречия способ, который устроит многих за исключением байесианцев.