Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Критерий Фишера при нулевом значении одного из показателей
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Acetylka
Доброго времени суток!
Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось.

Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть.
Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...)
Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий?

Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное.
p2004r
Цитата(Acetylka @ 27.06.2016 - 22:16) *
Доброго времени суток!
Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось.

Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть.
Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...)
Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий?

Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное.


Раз сравнивается частота экспрессии, то почему бы просто не посчитать доверительные интервалы для этой частоты?

0 исходов в группе из 25 случаев

Код
> Hmisc::binconf(0,25, method="all")
           PointEst Lower     Upper
Exact             0     0 0.1371852
Wilson            0     0 0.1331923
Asymptotic        0     0 0.0000000
Acetylka
Цитата(p2004r @ 27.06.2016 - 22:45) *
Раз сравнивается частота экспрессии, то почему бы просто не посчитать доверительные интервалы для этой частоты?

0 исходов в группе из 25 случаев

Код
> Hmisc::binconf(0,25, method="all")
           PointEst Lower     Upper
Exact             0     0 0.1371852
Wilson            0     0 0.1331923
Asymptotic        0     0 0.0000000



а что с ними дальше делать? в смысле как интерпретировать?
p2004r
Цитата(Acetylka @ 27.06.2016 - 23:00) *
а что с ними дальше делать? в смысле как интерпретировать?


Это доверительный интервал при частоте. Событие в генсовокупности в 95% "случаев оценки частоты подобных событий" окажется ниже верхнего предела и выше нижнего.

Если у разных частот интервалы "не пересекаются" значит они значимо (на уровне ошибки первого рода 0.05) отличаются.
Acetylka
спасибо за предложение, для интервалов даже вполне доступный онлайн-калькулятор нашла!
Осталось с научным руководителем согласовать)))
Acetylka
Цитата(p2004r @ 28.06.2016 - 20:15) *
Это доверительный интервал при частоте. Событие в генсовокупности в 95% "случаев оценки частоты подобных событий" окажется ниже верхнего предела и выше нижнего.

Если у разных частот интервалы "не пересекаются" значит они значимо (на уровне ошибки первого рода 0.05) отличаются.


спасибо за предложение, для интервалов даже вполне доступный онлайн-калькулятор нашла!
Осталось с научным руководителем согласовать)))
nokh
Цитата(Acetylka @ 28.06.2016 - 00:16) *
Доброго времени суток!
Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось.

Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть.
Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...)
Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий?

Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное.

Точный метод Фишера (ТМФ) разработан в предположении гипергеометрического распределения данных и его использование для анализа биномиально распределённых данных методологически некорректно. Для вычислительных возможностей почти столетней давности ТМФ был единственным способом анализа слабонасыщенных таблиц сопряжённости, поэтому на такую некорректность долгое время закрывали глаза, а потом большинство и вовсе забыло. А если постигать статистику по отечественным источникам, то и не знали, и забыли, и знать не хотят, и будут стоять на своём до конца.

Для анализа ваших данных нужен расчёт р-значения на основе биномиального распределения (exact permutation test, лучший пакет здесь - StatXact от Cytel Studio), хуже, но приемлемо - рандомизационный тест Монте-Карло, который генерирует не все возможные таблицы с данными краевыми частотами, а очень большое число случайных таких таблиц. Такой тест можно сделать в пакете PAST: http://folk.uio.no/ohammer/past/ Набить цифры в 4 ячейки, выделить, Путь: Univariate - Contingency table. Смотреть MonteCarlo p, а количество перевыборок увеличить в Permutation так, чтобы после Recompute значение MonteCarlo p не менялось в 4-5 знаке (9999 или 999999 или ещё больше).

Если находиться на позициях частотного (фриквентистского) подхода к проверке гипотез, то способ который предлагает p2004r обладает меньшей мощностью, т.к. 95%-ный ДИ строится для каждой доли отдельно, т.е. оба раза при построении ДИ половина имеющейся информации не используется. Лучше считать ДИ разности, чтобы задействовать в расчёте сразу обе частоты и не терять в мощности при получении значения p. Если же находиться в оппозиции к частотному подходу, то сравнение через сопоставление ДИ можно рассматривать как лишённый внутреннего противоречия способ, который устроит многих за исключением байесианцев.
100$
Цитата(Acetylka @ 27.06.2016 - 22:16) *
Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...)


В знаменателе окажется не нуль, а его факториал, который, вообще-то, равен 1.
nironir
Друзья, вы все такие умные, подскажите. Я не специалист мало чего смыслю в статистике. Вот почитал в инете о точном критерии Фишера. Тут на форуме его ругают мол ваще старье, ерунда. Но в инете я прочитал что он Равномерно наиболее мощный несмещенный критерий для проверки гипотезы о равенстве p двух биномиальных выборок (и в условном и в безусловном случае). Не могу понять, что это значит, было наивное знание из прошлого что равномерно наиболее мощный значит самый лучший в каком-то смысле. Нет? Формулы я нашел и выводы но вот сути я понять не смог.
Я понимаю что говорю глупости но все же существует ли "золотой стандарт" проверки гипотезы равенства частот в таблице сопряженности? Или в этом вопросе нет однозначного ответа типа "вот этот критерий самый лучший, мощный и все такое".
DoctorStat
Цитата(nironir @ 26.07.2016 - 15:53) *
Но в инете я прочитал что он Равномерно наиболее мощный несмещенный критерий для проверки гипотезы о равенстве p двух биномиальных выборок (и в условном и в безусловном случае). Не могу понять, что это значит...
Это значит, что он наиболее мощный критерий (дает минимальную ошибку второго рода) при фиксированном уровне ошибки первого рода.

Цитата(nironir @ 26.07.2016 - 15:53) *
Я понимаю что говорю глупости но все же существует ли "золотой стандарт" проверки гипотезы равенства частот в таблице сопряженности?
Эти два понятия: "Равномерно наиболее мощный несмещенный критерий" и "золотой стандарт проверки гипотез" эквивалентны smile.gif
DrgLena
На мой вигляд, в этой задаче достаточно провести сравнение 95% ДИ долей случаев с наличием экспрессии, как предложил р2004r. ДИ несут достаточно полную картину различий, особенно, если представить графически на одном рисунке доли всех 5 групп с их ДИ. Ясно, что различия имеются только между группами с нулевой экспрессией и последней.
0 ? 13,72
2,55-31,22
6,83-40,70
24,4-65,07
Это ДИ, если n=25 во всех группах (посчитанные по методу Клопера-Пирсона (Exact), как показал р2004r для первой группы.
Какую новую информацию предлагает получить nokh, я не совсем поняла. Предлагается только уточнение значения р в 4-5 знаке при сравнении двух групп, но сколько таких сравнений нужно сделать, вставляя цифры в 4 ячейки? Относительно ДИ к разности также не гуманно создавать множество таких разностей при сравнении всех 5 групп. Я согласна, что если бы было только две группы, то представление ДИ к разности долей было бы предпочтительней.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.