Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Критерий Фишера при нулевом значении одного из показателей
Acetylka
сообщение 27.06.2016 - 22:16
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 27.06.2016
Пользователь №: 28403



Доброго времени суток!
Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось.

Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть.
Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...)
Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий?

Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 27.06.2016 - 22:45
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Acetylka @ 27.06.2016 - 22:16) *
Доброго времени суток!
Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось.

Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть.
Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...)
Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий?

Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное.


Раз сравнивается частота экспрессии, то почему бы просто не посчитать доверительные интервалы для этой частоты?

0 исходов в группе из 25 случаев

Код
> Hmisc::binconf(0,25, method="all")
           PointEst Lower     Upper
Exact             0     0 0.1371852
Wilson            0     0 0.1331923
Asymptotic        0     0 0.0000000


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Acetylka
сообщение 27.06.2016 - 23:00
Сообщение #3





Группа: Пользователи
Сообщений: 4
Регистрация: 27.06.2016
Пользователь №: 28403



Цитата(p2004r @ 27.06.2016 - 22:45) *
Раз сравнивается частота экспрессии, то почему бы просто не посчитать доверительные интервалы для этой частоты?

0 исходов в группе из 25 случаев

Код
> Hmisc::binconf(0,25, method="all")
           PointEst Lower     Upper
Exact             0     0 0.1371852
Wilson            0     0 0.1331923
Asymptotic        0     0 0.0000000



а что с ними дальше делать? в смысле как интерпретировать?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 28.06.2016 - 20:15
Сообщение #4





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Acetylka @ 27.06.2016 - 23:00) *
а что с ними дальше делать? в смысле как интерпретировать?


Это доверительный интервал при частоте. Событие в генсовокупности в 95% "случаев оценки частоты подобных событий" окажется ниже верхнего предела и выше нижнего.

Если у разных частот интервалы "не пересекаются" значит они значимо (на уровне ошибки первого рода 0.05) отличаются.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Acetylka
сообщение 29.06.2016 - 21:29
Сообщение #5





Группа: Пользователи
Сообщений: 4
Регистрация: 27.06.2016
Пользователь №: 28403



спасибо за предложение, для интервалов даже вполне доступный онлайн-калькулятор нашла!
Осталось с научным руководителем согласовать)))
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Acetylka
сообщение 29.06.2016 - 21:31
Сообщение #6





Группа: Пользователи
Сообщений: 4
Регистрация: 27.06.2016
Пользователь №: 28403



Цитата(p2004r @ 28.06.2016 - 20:15) *
Это доверительный интервал при частоте. Событие в генсовокупности в 95% "случаев оценки частоты подобных событий" окажется ниже верхнего предела и выше нижнего.

Если у разных частот интервалы "не пересекаются" значит они значимо (на уровне ошибки первого рода 0.05) отличаются.


спасибо за предложение, для интервалов даже вполне доступный онлайн-калькулятор нашла!
Осталось с научным руководителем согласовать)))
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 29.06.2016 - 22:02
Сообщение #7





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Acetylka @ 28.06.2016 - 00:16) *
Доброго времени суток!
Возможно подобный вопрос на форуме уже обсуждали, но найти ответ мне к сожалению не удалось.

Существуют группы наблюдений по 26-28 случаев, в каждой из групп оценивается один признак - наличие или отсутствие экспрессии белка1. Оценка производится на основании изучения микропрепаратов, на данном этапе оцениваю по бинарной шкале "да/нет". Для определения достоверности различий между группами планировала использовать критерий Фишера, но вот незадача - в двух группах экспрессия отсутствует, в остальных группах в 3, 5 и 11 случаях экспрессия есть.
Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...)
Если нельзя использовать критерий Фишера, то как можно оценить достоверность различий?

Заранее прошу прощения, если вопрос покажется глупым - статистика для меня пока поле совершенно неизведанное.

Точный метод Фишера (ТМФ) разработан в предположении гипергеометрического распределения данных и его использование для анализа биномиально распределённых данных методологически некорректно. Для вычислительных возможностей почти столетней давности ТМФ был единственным способом анализа слабонасыщенных таблиц сопряжённости, поэтому на такую некорректность долгое время закрывали глаза, а потом большинство и вовсе забыло. А если постигать статистику по отечественным источникам, то и не знали, и забыли, и знать не хотят, и будут стоять на своём до конца.

Для анализа ваших данных нужен расчёт р-значения на основе биномиального распределения (exact permutation test, лучший пакет здесь - StatXact от Cytel Studio), хуже, но приемлемо - рандомизационный тест Монте-Карло, который генерирует не все возможные таблицы с данными краевыми частотами, а очень большое число случайных таких таблиц. Такой тест можно сделать в пакете PAST: http://folk.uio.no/ohammer/past/ Набить цифры в 4 ячейки, выделить, Путь: Univariate - Contingency table. Смотреть MonteCarlo p, а количество перевыборок увеличить в Permutation так, чтобы после Recompute значение MonteCarlo p не менялось в 4-5 знаке (9999 или 999999 или ещё больше).

Если находиться на позициях частотного (фриквентистского) подхода к проверке гипотез, то способ который предлагает p2004r обладает меньшей мощностью, т.к. 95%-ный ДИ строится для каждой доли отдельно, т.е. оба раза при построении ДИ половина имеющейся информации не используется. Лучше считать ДИ разности, чтобы задействовать в расчёте сразу обе частоты и не терять в мощности при получении значения p. Если же находиться в оппозиции к частотному подходу, то сравнение через сопоставление ДИ можно рассматривать как лишённый внутреннего противоречия способ, который устроит многих за исключением байесианцев.

Сообщение отредактировал nokh - 29.06.2016 - 22:09
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 30.06.2016 - 13:54
Сообщение #8





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Acetylka @ 27.06.2016 - 22:16) *
Можно ли как-то рассчитать критерий Фишера с этим "нулем"? (насколько я поняла из формулы, он окажется в знаменателе...)


В знаменателе окажется не нуль, а его факториал, который, вообще-то, равен 1.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nironir
сообщение 26.07.2016 - 15:53
Сообщение #9





Группа: Пользователи
Сообщений: 8
Регистрация: 26.07.2016
Пользователь №: 28496



Друзья, вы все такие умные, подскажите. Я не специалист мало чего смыслю в статистике. Вот почитал в инете о точном критерии Фишера. Тут на форуме его ругают мол ваще старье, ерунда. Но в инете я прочитал что он Равномерно наиболее мощный несмещенный критерий для проверки гипотезы о равенстве p двух биномиальных выборок (и в условном и в безусловном случае). Не могу понять, что это значит, было наивное знание из прошлого что равномерно наиболее мощный значит самый лучший в каком-то смысле. Нет? Формулы я нашел и выводы но вот сути я понять не смог.
Я понимаю что говорю глупости но все же существует ли "золотой стандарт" проверки гипотезы равенства частот в таблице сопряженности? Или в этом вопросе нет однозначного ответа типа "вот этот критерий самый лучший, мощный и все такое".

Сообщение отредактировал nironir - 26.07.2016 - 15:56
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 27.07.2016 - 10:26
Сообщение #10





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(nironir @ 26.07.2016 - 15:53) *
Но в инете я прочитал что он Равномерно наиболее мощный несмещенный критерий для проверки гипотезы о равенстве p двух биномиальных выборок (и в условном и в безусловном случае). Не могу понять, что это значит...
Это значит, что он наиболее мощный критерий (дает минимальную ошибку второго рода) при фиксированном уровне ошибки первого рода.

Цитата(nironir @ 26.07.2016 - 15:53) *
Я понимаю что говорю глупости но все же существует ли "золотой стандарт" проверки гипотезы равенства частот в таблице сопряженности?
Эти два понятия: "Равномерно наиболее мощный несмещенный критерий" и "золотой стандарт проверки гипотез" эквивалентны smile.gif


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 27.07.2016 - 11:54
Сообщение #11





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



На мой вигляд, в этой задаче достаточно провести сравнение 95% ДИ долей случаев с наличием экспрессии, как предложил р2004r. ДИ несут достаточно полную картину различий, особенно, если представить графически на одном рисунке доли всех 5 групп с их ДИ. Ясно, что различия имеются только между группами с нулевой экспрессией и последней.
0 ? 13,72
2,55-31,22
6,83-40,70
24,4-65,07
Это ДИ, если n=25 во всех группах (посчитанные по методу Клопера-Пирсона (Exact), как показал р2004r для первой группы.
Какую новую информацию предлагает получить nokh, я не совсем поняла. Предлагается только уточнение значения р в 4-5 знаке при сравнении двух групп, но сколько таких сравнений нужно сделать, вставляя цифры в 4 ячейки? Относительно ДИ к разности также не гуманно создавать множество таких разностей при сравнении всех 5 групп. Я согласна, что если бы было только две группы, то представление ДИ к разности долей было бы предпочтительней.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему