Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Сравнение частоты встречаемости
ple
сообщение 21.12.2007 - 10:13
Сообщение #1





Группа: Пользователи
Сообщений: 7
Регистрация: 21.12.2007
Пользователь №: 4639



Есть две выборки (100 здоровых и 105 с ожирением) - мужчины, одного возраста - хочется узнать достоверны ли различия в частоте встречаемости гипертрофии левого желудочка (здоровых 10%, ожирелых 30%) - скажите, пожалуйста, какой критерий оптимальнее использовать для сравнения этих групп? Большое спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
плав
сообщение 27.12.2007 - 21:40
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Насчет того, что 30% от 105 - это 35 я как-то не понял. 35/105=0,3333. А 30% от 105 - это 31,5 (округляем до 32)... Но на самом деле вопрос не в том, какая там цифра идет после большого количества нулей, а в том, что результат сильно не меняется при использовании всех методов. Проблема в другом. Меня смущает использование методов, которые считаются "более" хорошими просто потому, что кто-то когда-то так написал в ущерб тем методам, которые используются уже давно. С моей точки зрения это обоснованно тогда, когда новый метод дает дополнительную информацию или позволяет избавиться от одних допущений не внося другие. Как же в этом случае выглядит метод Фишера?
Давайте попробуем сформулировать нулевую гипотезу. Итак, по методу Фишера мы рассчитываем вероятность получения таблицы такой же или еще более отличающейся от "нулевой" (созданной на основе краевых частот) в случае взятия выборок из одной и той же популяции. Всякий, кто знаком с ручным расчетом по методу Фишера знает, что мы берем и фиксируем ВСЕ краевые частоты и затем рассчитываем количество таблиц, которое могло бы появиться с данными значениями частот в таблице. Повторюсь еще раз, мы фиксируем все краевые частоты, т.е. мы считаем, что в выборке известна не только численность групп, но и фиксирована распространенность изучемого фактора риска. В приводимом примере это означает, что мы считаем, что во всех взятых выборках не только будет 105 и 100 человек (что мы делаем самостоятельно, произвольно деля выборку в 205 человек на такие части), но и во всех выборках распространенность ГЛЖ будет 20,5%. Каждый, кто хоть раз пытался играть со случайными выборками понимает, что это очень сомнительное допущение, но именно оно лежит в основе расчетов по методу Фишера и его производным.
В противоположность этому хи2 не делает таких допущений о структуре таблицы (он вообще никаких допущений не делает, поскольку хи2 это всего лишь способ суммарно описать таблицу, это - статистика). Соответственно, он легко расчитывается при разных допущениях нулевой гипотезы (например, что в общей популяции распространенность ГЛЖ составляет 10% или, наоборот, 30%). Другое дело, что стандратная тактика использования критерия хи2 исходит из сравнения полученного значения с табличными, рассчитанными при определенных допущениях, но никто не обязывает действовать таким образом. Есть, в конце концов, bootstrap и можно спокойно сделать распределение хи2 для конкретного эксперимента, благо вычислительные средства позволяют. На самом деле, вместо хи2 можно использовать, например, OR и сделать bootstrap распределение для OR и рассчитать все те же вероятности нулевой гипотезы.
Я отнюдь не призываю использовать bootstrap вместо критерия Фишера, однако хочу лишь указать, что все методы имеют свои проблемы (и bootstrap тоже) и всегда найдется кто-то, кто может раскритиковать использованную методологию статистической обработки с точки зрения обоснованности использованных допущений - без допущений моделей не существует. Соответственно, лучше обращать больше внимания на содеражтельную часть и адекватность анализа именно с содержательной точки зрения.
И вот тут мы подходим к моему последнему замечанию. Итак, о чем идет речь в задачке? Спорстсмены сравниваются с лицами не занимавшимися спортом (и имеющими ожирение)? Тогда задача и подавно бессмысленна - классика сравнения яблок с апельсинами. Если убрать очень специфическую группу спорстменов, наиболее частая причина ГЛЖ - АГ, у лиц с ожирением чаще встречается АГ, игнорирование АГ как третьей переменной является, на сегодняшнем уровне знаний ошибкой и никакой Lancet подобную зависимость двух факторов, которая игнорирует очевидную третью переменную не признает как существующую. Статистическая корреляция не есть причинно-следственная связь. И вот организация исследования в смысле адекватного учета всех факторов куда важнее, чем использовался хи2, критерий Фишера или Кохрана-Мантеля-Ханзеля, ибо статистические методы дадут сходные результаты, а неадекватный дизайн сводит на нет все исследование.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- ple   Сравнение частоты встречаемости   21.12.2007 - 10:13
- - Игорь   Точный метод Фишера Статистика критерия 4,03442937...   21.12.2007 - 11:09
- - DrgLena   В подобных случаях предпочтительней использовать н...   21.12.2007 - 20:35
- - ple   Спасибо за Ваш ответ. Вот только у меня почему-то ...   24.12.2007 - 09:42
- - Игорь   На Томском сайте "Биометрика" В.П. Леоно...   24.12.2007 - 09:52
- - ple   Еще раз больше Вам спасибо!   24.12.2007 - 10:26
- - ple   А вот еще вопрос - не могу разобрать, какие значен...   24.12.2007 - 11:04
- - Игорь   Вот здесь еще программа есть http://www.med.uio.no...   24.12.2007 - 12:29
- - плав   А вот мне непонятно, зачем пытаться использовать к...   24.12.2007 - 21:40
- - DrgLena   Это не Two-by-two задача. Хи квадрат Пирсона даст ...   24.12.2007 - 23:54
- - Игорь   Главная сложность или, если хотите, изюминка при в...   25.12.2007 - 06:42
- - ple   Да - нет - студенческая задачка ) Интересно, пре...   25.12.2007 - 12:31
|- - плав   Цитата(ple @ 25.12.2007 - 12:31) Да ...   26.12.2007 - 23:28
- - Игорь   Сегодня остановился бы на двух вопросах. 1. Зачем...   26.12.2007 - 11:31
- - плав   Ответ "можно использовать" не совсем на ...   26.12.2007 - 23:20
- - Игорь   Проверять правильность одной программы с помощью д...   27.12.2007 - 07:06
- - DrgLena   Игорь, первый постер висит и входные данные привед...   27.12.2007 - 15:06
- - плав   Насчет того, что 30% от 105 - это 35 я как-то не п...   27.12.2007 - 21:40
- - DrgLena   PLE обратился с конкретным вопросом о влиянии ожир...   29.12.2007 - 01:34
- - плав   На самом деле дизайн исследования имеет непосредст...   29.12.2007 - 13:35
- - DrgLena   Не могу согласиться, что эта задачка из «ран...   29.12.2007 - 18:16
- - плав   Неплохо бы внимательно читать пост, прежде, чем об...   4.01.2008 - 17:31
- - DrgLena   Давайте вернемся к нашим баранам, вернее к черным...   5.01.2008 - 00:24
- - плав   Вопрос, напомню, был какой критерий лучше использо...   5.01.2008 - 11:23
- - DrgLena   Полностью согласна. Дизайн исследования определяет...   5.01.2008 - 13:46


Добавить ответ в эту темуОткрыть тему