Критерий Фишера при нулевом значении одного из показателей - Форум врачей-аспирантов

Форум врачей-аспирантов

Правила форума

Пользователи

Календарь

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Добавить ответ в эту тему

Открыть тему

Критерий Фишера при нулевом значении одного из показателей

Acetylka Просмотр профиля	27.06.2016 - 22:16 Сообщение #1
Группа: Пользователи Сообщений: 4 Регистрация: 27.06.2016 Пользователь №: 28403	Доброго времени суток! Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось. Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть. Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...) Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий? Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное.

p2004r Просмотр профиля	27.06.2016 - 22:45 Сообщение #2
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(Acetylka @ 27.06.2016 - 22:16) Доброго времени суток! Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось. Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть. Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...) Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий? Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное. Раз сравнивается частота экспрессии, то почему бы просто не посчитать доверительные интервалы для этой частоты? 0 исходов в группе из 25 случаев Код > Hmisc::binconf(0,25, method="all") PointEst Lower Upper Exact 0 0 0.1371852 Wilson 0 0 0.1331923 Asymptotic 0 0 0.0000000 http://r-statistics.livejournal.com/

Acetylka Просмотр профиля	27.06.2016 - 23:00 Сообщение #3
Группа: Пользователи Сообщений: 4 Регистрация: 27.06.2016 Пользователь №: 28403	Цитата(p2004r @ 27.06.2016 - 22:45) Раз сравнивается частота экспрессии, то почему бы просто не посчитать доверительные интервалы для этой частоты? 0 исходов в группе из 25 случаев Код > Hmisc::binconf(0,25, method="all") PointEst Lower Upper Exact 0 0 0.1371852 Wilson 0 0 0.1331923 Asymptotic 0 0 0.0000000 а что с ними дальше делать? в смысле как интерпретировать?

p2004r Просмотр профиля	28.06.2016 - 20:15 Сообщение #4
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(Acetylka @ 27.06.2016 - 23:00) а что с ними дальше делать? в смысле как интерпретировать? Это доверительный интервал при частоте. Событие в генсовокупности в 95% "случаев оценки частоты подобных событий" окажется ниже верхнего предела и выше нижнего. Если у разных частот интервалы "не пересекаются" значит они значимо (на уровне ошибки первого рода 0.05) отличаются. http://r-statistics.livejournal.com/

Acetylka Просмотр профиля	29.06.2016 - 21:29 Сообщение #5
Группа: Пользователи Сообщений: 4 Регистрация: 27.06.2016 Пользователь №: 28403	спасибо за предложение, для интервалов даже вполне доступный онлайн-калькулятор нашла! Осталось с научным руководителем согласовать)))

Acetylka Просмотр профиля	29.06.2016 - 21:31 Сообщение #6
Группа: Пользователи Сообщений: 4 Регистрация: 27.06.2016 Пользователь №: 28403	Цитата(p2004r @ 28.06.2016 - 20:15) Это доверительный интервал при частоте. Событие в генсовокупности в 95% "случаев оценки частоты подобных событий" окажется ниже верхнего предела и выше нижнего. Если у разных частот интервалы "не пересекаются" значит они значимо (на уровне ошибки первого рода 0.05) отличаются. спасибо за предложение, для интервалов даже вполне доступный онлайн-калькулятор нашла! Осталось с научным руководителем согласовать)))

nokh Просмотр профиля	29.06.2016 - 22:02 Сообщение #7
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(Acetylka @ 28.06.2016 - 00:16) Доброго времени суток! Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось. Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть. Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...) Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий? Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное. Точный метод Фишера (ТМФ) разработан в предположении гипергеометрического распределения данных и его использование для анализа биномиально распределённых данных методологически некорректно. Для вычислительных возможностей почти столетней давности ТМФ был единственным способом анализа слабонасыщенных таблиц сопряжённости, поэтому на такую некорректность долгое время закрывали глаза, а потом большинство и вовсе забыло. А если постигать статистику по отечественным источникам, то и не знали, и забыли, и знать не хотят, и будут стоять на своём до конца. Для анализа ваших данных нужен расчёт р-значения на основе биномиального распределения (exact permutation test, лучший пакет здесь - StatXact от Cytel Studio), хуже, но приемлемо - рандомизационный тест Монте-Карло, который генерирует не все возможные таблицы с данными краевыми частотами, а очень большое число случайных таких таблиц. Такой тест можно сделать в пакете PAST: http://folk.uio.no/ohammer/past/ Набить цифры в 4 ячейки, выделить, Путь: Univariate - Contingency table. Смотреть MonteCarlo p, а количество перевыборок увеличить в Permutation так, чтобы после Recompute значение MonteCarlo p не менялось в 4-5 знаке (9999 или 999999 или ещё больше). Если находиться на позициях частотного (фриквентистского) подхода к проверке гипотез, то способ который предлагает p2004r обладает меньшей мощностью, т.к. 95%-ный ДИ строится для каждой доли отдельно, т.е. оба раза при построении ДИ половина имеющейся информации не используется. Лучше считать ДИ разности, чтобы задействовать в расчёте сразу обе частоты и не терять в мощности при получении значения p. Если же находиться в оппозиции к частотному подходу, то сравнение через сопоставление ДИ можно рассматривать как лишённый внутреннего противоречия способ, который устроит многих за исключением байесианцев. Сообщение отредактировал nokh - 29.06.2016 - 22:09

100$ Просмотр профиля	30.06.2016 - 13:54 Сообщение #8
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Цитата(Acetylka @ 27.06.2016 - 22:16) Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...) В знаменателе окажется не нуль, а его факториал, который, вообще-то, равен 1.

nironir Просмотр профиля	26.07.2016 - 15:53 Сообщение #9
Группа: Пользователи Сообщений: 8 Регистрация: 26.07.2016 Пользователь №: 28496	Друзья, вы все такие умные, подскажите. Я не специалист мало чего смыслю в статистике. Вот почитал в инете о точном критерии Фишера. Тут на форуме его ругают мол ваще старье, ерунда. Но в инете я прочитал что он Равномерно наиболее мощный несмещенный критерий для проверки гипотезы о равенстве p двух биномиальных выборок (и в условном и в безусловном случае). Не могу понять, что это значит, было наивное знание из прошлого что равномерно наиболее мощный значит самый лучший в каком-то смысле. Нет? Формулы я нашел и выводы но вот сути я понять не смог. Я понимаю что говорю глупости но все же существует ли "золотой стандарт" проверки гипотезы равенства частот в таблице сопряженности? Или в этом вопросе нет однозначного ответа типа "вот этот критерий самый лучший, мощный и все такое". Сообщение отредактировал nironir - 26.07.2016 - 15:56

DoctorStat Просмотр профиля	27.07.2016 - 10:26 Сообщение #10
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224	Цитата(nironir @ 26.07.2016 - 15:53) Но в инете я прочитал что он Равномерно наиболее мощный несмещенный критерий для проверки гипотезы о равенстве p двух биномиальных выборок (и в условном и в безусловном случае). Не могу понять, что это значит... Это значит, что он наиболее мощный критерий (дает минимальную ошибку второго рода) при фиксированном уровне ошибки первого рода. Цитата(nironir @ 26.07.2016 - 15:53) Я понимаю что говорю глупости но все же существует ли "золотой стандарт" проверки гипотезы равенства частот в таблице сопряженности? Эти два понятия: "Равномерно наиболее мощный несмещенный критерий" и "золотой стандарт проверки гипотез" эквивалентны Просто включи мозги => http://doctorstat.narod.ru

DrgLena Просмотр профиля	27.07.2016 - 11:54 Сообщение #11
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	На мой вигляд, в этой задаче достаточно провести сравнение 95% ДИ долей случаев с наличием экспрессии, как предложил р2004r. ДИ несут достаточно полную картину различий, особенно, если представить графически на одном рисунке доли всех 5 групп с их ДИ. Ясно, что различия имеются только между группами с нулевой экспрессией и последней. 0 ? 13,72 2,55-31,22 6,83-40,70 24,4-65,07 Это ДИ, если n=25 во всех группах (посчитанные по методу Клопера-Пирсона (Exact), как показал р2004r для первой группы. Какую новую информацию предлагает получить nokh, я не совсем поняла. Предлагается только уточнение значения р в 4-5 знаке при сравнении двух групп, но сколько таких сравнений нужно сделать, вставляя цифры в 4 ячейки? Относительно ДИ к разности также не гуманно создавать множество таких разностей при сравнении всех 5 групп. Я согласна, что если бы было только две группы, то представление ДИ к разности долей было бы предпочтительней.

« Предыдущая тема · Медицинская статистика · Следующая тема »

Добавить ответ в эту тему

Открыть тему

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Форум IP.Board © 2024 IPS, Inc.