Критерий Фишера при нулевом значении одного из показателей |
Здравствуйте, гость ( Вход | Регистрация )
Критерий Фишера при нулевом значении одного из показателей |
27.06.2016 - 22:16
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 27.06.2016 Пользователь №: 28403 |
Доброго времени суток!
Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось. Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть. Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...) Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий? Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное. |
|
27.06.2016 - 22:45
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Доброго времени суток! Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось. Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть. Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...) Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий? Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное. Раз сравнивается частота экспрессии, то почему бы просто не посчитать доверительные интервалы для этой частоты? 0 исходов в группе из 25 случаев Код > Hmisc::binconf(0,25, method="all")
PointEst Lower Upper Exact 0 0 0.1371852 Wilson 0 0 0.1331923 Asymptotic 0 0 0.0000000 |
|
27.06.2016 - 23:00
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 27.06.2016 Пользователь №: 28403 |
Раз сравнивается частота экспрессии, то почему бы просто не посчитать доверительные интервалы для этой частоты? 0 исходов в группе из 25 случаев Код > Hmisc::binconf(0,25, method="all") PointEst Lower Upper Exact 0 0 0.1371852 Wilson 0 0 0.1331923 Asymptotic 0 0 0.0000000 а что с ними дальше делать? в смысле как интерпретировать? |
|
28.06.2016 - 20:15
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
а что с ними дальше делать? в смысле как интерпретировать? Это доверительный интервал при частоте. Событие в генсовокупности в 95% "случаев оценки частоты подобных событий" окажется ниже верхнего предела и выше нижнего. Если у разных частот интервалы "не пересекаются" значит они значимо (на уровне ошибки первого рода 0.05) отличаются. |
|
29.06.2016 - 21:29
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 27.06.2016 Пользователь №: 28403 |
спасибо за предложение, для интервалов даже вполне доступный онлайн-калькулятор нашла!
Осталось с научным руководителем согласовать))) |
|
29.06.2016 - 21:31
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 27.06.2016 Пользователь №: 28403 |
Это доверительный интервал при частоте. Событие в генсовокупности в 95% "случаев оценки частоты подобных событий" окажется ниже верхнего предела и выше нижнего. Если у разных частот интервалы "не пересекаются" значит они значимо (на уровне ошибки первого рода 0.05) отличаются. спасибо за предложение, для интервалов даже вполне доступный онлайн-калькулятор нашла! Осталось с научным руководителем согласовать))) |
|
29.06.2016 - 22:02
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Доброго времени суток! Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось. Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть. Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...) Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий? Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное. Точный метод Фишера (ТМФ) разработан в предположении гипергеометрического распределения данных и его использование для анализа биномиально распределённых данных методологически некорректно. Для вычислительных возможностей почти столетней давности ТМФ был единственным способом анализа слабонасыщенных таблиц сопряжённости, поэтому на такую некорректность долгое время закрывали глаза, а потом большинство и вовсе забыло. А если постигать статистику по отечественным источникам, то и не знали, и забыли, и знать не хотят, и будут стоять на своём до конца. Для анализа ваших данных нужен расчёт р-значения на основе биномиального распределения (exact permutation test, лучший пакет здесь - StatXact от Cytel Studio), хуже, но приемлемо - рандомизационный тест Монте-Карло, который генерирует не все возможные таблицы с данными краевыми частотами, а очень большое число случайных таких таблиц. Такой тест можно сделать в пакете PAST: http://folk.uio.no/ohammer/past/ Набить цифры в 4 ячейки, выделить, Путь: Univariate - Contingency table. Смотреть MonteCarlo p, а количество перевыборок увеличить в Permutation так, чтобы после Recompute значение MonteCarlo p не менялось в 4-5 знаке (9999 или 999999 или ещё больше). Если находиться на позициях частотного (фриквентистского) подхода к проверке гипотез, то способ который предлагает p2004r обладает меньшей мощностью, т.к. 95%-ный ДИ строится для каждой доли отдельно, т.е. оба раза при построении ДИ половина имеющейся информации не используется. Лучше считать ДИ разности, чтобы задействовать в расчёте сразу обе частоты и не терять в мощности при получении значения p. Если же находиться в оппозиции к частотному подходу, то сравнение через сопоставление ДИ можно рассматривать как лишённый внутреннего противоречия способ, который устроит многих за исключением байесианцев. Сообщение отредактировал nokh - 29.06.2016 - 22:09 |
|
30.06.2016 - 13:54
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
|
|
26.07.2016 - 15:53
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 26.07.2016 Пользователь №: 28496 |
Друзья, вы все такие умные, подскажите. Я не специалист мало чего смыслю в статистике. Вот почитал в инете о точном критерии Фишера. Тут на форуме его ругают мол ваще старье, ерунда. Но в инете я прочитал что он Равномерно наиболее мощный несмещенный критерий для проверки гипотезы о равенстве p двух биномиальных выборок (и в условном и в безусловном случае). Не могу понять, что это значит, было наивное знание из прошлого что равномерно наиболее мощный значит самый лучший в каком-то смысле. Нет? Формулы я нашел и выводы но вот сути я понять не смог.
Я понимаю что говорю глупости но все же существует ли "золотой стандарт" проверки гипотезы равенства частот в таблице сопряженности? Или в этом вопросе нет однозначного ответа типа "вот этот критерий самый лучший, мощный и все такое". Сообщение отредактировал nironir - 26.07.2016 - 15:56 |
|
27.07.2016 - 10:26
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Но в инете я прочитал что он Равномерно наиболее мощный несмещенный критерий для проверки гипотезы о равенстве p двух биномиальных выборок (и в условном и в безусловном случае). Не могу понять, что это значит... Это значит, что он наиболее мощный критерий (дает минимальную ошибку второго рода) при фиксированном уровне ошибки первого рода.Я понимаю что говорю глупости но все же существует ли "золотой стандарт" проверки гипотезы равенства частот в таблице сопряженности? Эти два понятия: "Равномерно наиболее мощный несмещенный критерий" и "золотой стандарт проверки гипотез" эквивалентны Просто включи мозги => http://doctorstat.narod.ru
|
|
27.07.2016 - 11:54
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
На мой вигляд, в этой задаче достаточно провести сравнение 95% ДИ долей случаев с наличием экспрессии, как предложил р2004r. ДИ несут достаточно полную картину различий, особенно, если представить графически на одном рисунке доли всех 5 групп с их ДИ. Ясно, что различия имеются только между группами с нулевой экспрессией и последней.
0 ? 13,72 2,55-31,22 6,83-40,70 24,4-65,07 Это ДИ, если n=25 во всех группах (посчитанные по методу Клопера-Пирсона (Exact), как показал р2004r для первой группы. Какую новую информацию предлагает получить nokh, я не совсем поняла. Предлагается только уточнение значения р в 4-5 знаке при сравнении двух групп, но сколько таких сравнений нужно сделать, вставляя цифры в 4 ячейки? Относительно ДИ к разности также не гуманно создавать множество таких разностей при сравнении всех 5 групп. Я согласна, что если бы было только две группы, то представление ДИ к разности долей было бы предпочтительней. |
|