Сравнение частоты встречаемости - Форум врачей-аспирантов

Сравнение частоты встречаемости

ple Просмотр профиля	21.12.2007 - 10:13 Сообщение #1
Группа: Пользователи Сообщений: 7 Регистрация: 21.12.2007 Пользователь №: 4639	Есть две выборки (100 здоровых и 105 с ожирением) - мужчины, одного возраста - хочется узнать достоверны ли различия в частоте встречаемости гипертрофии левого желудочка (здоровых 10%, ожирелых 30%) - скажите, пожалуйста, какой критерий оптимальнее использовать для сравнения этих групп? Большое спасибо.

Ответов

плав Просмотр профиля	27.12.2007 - 21:40 Сообщение #2
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Насчет того, что 30% от 105 - это 35 я как-то не понял. 35/105=0,3333. А 30% от 105 - это 31,5 (округляем до 32)... Но на самом деле вопрос не в том, какая там цифра идет после большого количества нулей, а в том, что результат сильно не меняется при использовании всех методов. Проблема в другом. Меня смущает использование методов, которые считаются "более" хорошими просто потому, что кто-то когда-то так написал в ущерб тем методам, которые используются уже давно. С моей точки зрения это обоснованно тогда, когда новый метод дает дополнительную информацию или позволяет избавиться от одних допущений не внося другие. Как же в этом случае выглядит метод Фишера? Давайте попробуем сформулировать нулевую гипотезу. Итак, по методу Фишера мы рассчитываем вероятность получения таблицы такой же или еще более отличающейся от "нулевой" (созданной на основе краевых частот) в случае взятия выборок из одной и той же популяции. Всякий, кто знаком с ручным расчетом по методу Фишера знает, что мы берем и фиксируем ВСЕ краевые частоты и затем рассчитываем количество таблиц, которое могло бы появиться с данными значениями частот в таблице. Повторюсь еще раз, мы фиксируем все краевые частоты, т.е. мы считаем, что в выборке известна не только численность групп, но и фиксирована распространенность изучемого фактора риска. В приводимом примере это означает, что мы считаем, что во всех взятых выборках не только будет 105 и 100 человек (что мы делаем самостоятельно, произвольно деля выборку в 205 человек на такие части), но и во всех выборках распространенность ГЛЖ будет 20,5%. Каждый, кто хоть раз пытался играть со случайными выборками понимает, что это очень сомнительное допущение, но именно оно лежит в основе расчетов по методу Фишера и его производным. В противоположность этому хи2 не делает таких допущений о структуре таблицы (он вообще никаких допущений не делает, поскольку хи2 это всего лишь способ суммарно описать таблицу, это - статистика). Соответственно, он легко расчитывается при разных допущениях нулевой гипотезы (например, что в общей популяции распространенность ГЛЖ составляет 10% или, наоборот, 30%). Другое дело, что стандратная тактика использования критерия хи2 исходит из сравнения полученного значения с табличными, рассчитанными при определенных допущениях, но никто не обязывает действовать таким образом. Есть, в конце концов, bootstrap и можно спокойно сделать распределение хи2 для конкретного эксперимента, благо вычислительные средства позволяют. На самом деле, вместо хи2 можно использовать, например, OR и сделать bootstrap распределение для OR и рассчитать все те же вероятности нулевой гипотезы. Я отнюдь не призываю использовать bootstrap вместо критерия Фишера, однако хочу лишь указать, что все методы имеют свои проблемы (и bootstrap тоже) и всегда найдется кто-то, кто может раскритиковать использованную методологию статистической обработки с точки зрения обоснованности использованных допущений - без допущений моделей не существует. Соответственно, лучше обращать больше внимания на содеражтельную часть и адекватность анализа именно с содержательной точки зрения. И вот тут мы подходим к моему последнему замечанию. Итак, о чем идет речь в задачке? Спорстсмены сравниваются с лицами не занимавшимися спортом (и имеющими ожирение)? Тогда задача и подавно бессмысленна - классика сравнения яблок с апельсинами. Если убрать очень специфическую группу спорстменов, наиболее частая причина ГЛЖ - АГ, у лиц с ожирением чаще встречается АГ, игнорирование АГ как третьей переменной является, на сегодняшнем уровне знаний ошибкой и никакой Lancet подобную зависимость двух факторов, которая игнорирует очевидную третью переменную не признает как существующую. Статистическая корреляция не есть причинно-следственная связь. И вот организация исследования в смысле адекватного учета всех факторов куда важнее, чем использовался хи2, критерий Фишера или Кохрана-Мантеля-Ханзеля, ибо статистические методы дадут сходные результаты, а неадекватный дизайн сводит на нет все исследование.

Сообщений в этой теме

ple Сравнение частоты встречаемости 21.12.2007 - 10:13

Игорь Точный метод Фишера Статистика критерия 4,03442937... 21.12.2007 - 11:09

DrgLena В подобных случаях предпочтительней использовать н... 21.12.2007 - 20:35

ple Спасибо за Ваш ответ. Вот только у меня почему-то ... 24.12.2007 - 09:42

Игорь На Томском сайте "Биометрика" В.П. Леоно... 24.12.2007 - 09:52

ple Еще раз больше Вам спасибо! 24.12.2007 - 10:26

ple А вот еще вопрос - не могу разобрать, какие значен... 24.12.2007 - 11:04

Игорь Вот здесь еще программа есть http://www.med.uio.no... 24.12.2007 - 12:29

плав А вот мне непонятно, зачем пытаться использовать к... 24.12.2007 - 21:40

DrgLena Это не Two-by-two задача. Хи квадрат Пирсона даст ... 24.12.2007 - 23:54

Игорь Главная сложность или, если хотите, изюминка при в... 25.12.2007 - 06:42

ple Да - нет - студенческая задачка ) Интересно, пре... 25.12.2007 - 12:31

плав Цитата(ple @ 25.12.2007 - 12:31) Да ... 26.12.2007 - 23:28

Игорь Сегодня остановился бы на двух вопросах. 1. Зачем... 26.12.2007 - 11:31

плав Ответ "можно использовать" не совсем на ... 26.12.2007 - 23:20

Игорь Проверять правильность одной программы с помощью д... 27.12.2007 - 07:06

DrgLena Игорь, первый постер висит и входные данные привед... 27.12.2007 - 15:06

плав Насчет того, что 30% от 105 - это 35 я как-то не п... 27.12.2007 - 21:40

DrgLena PLE обратился с конкретным вопросом о влиянии ожир... 29.12.2007 - 01:34

плав На самом деле дизайн исследования имеет непосредст... 29.12.2007 - 13:35

DrgLena Не могу согласиться, что эта задачка из «ран... 29.12.2007 - 18:16

плав Неплохо бы внимательно читать пост, прежде, чем об... 4.01.2008 - 17:31

DrgLena Давайте вернемся к нашим баранам, вернее к черным... 5.01.2008 - 00:24

плав Вопрос, напомню, был какой критерий лучше использо... 5.01.2008 - 11:23

DrgLena Полностью согласна. Дизайн исследования определяет... 5.01.2008 - 13:46

« Предыдущая тема · Медицинская статистика · Следующая тема »