Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Выбор метода при анализе показателей заболеваемости
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Stefa
Добрый день!

Подскажите, пожалуйста, каким методом можно воспользоваться в данном случае, и вообще уместно ли применять какие либо методы? Есть данные по болезненности (количество обращений к врачу на 1000 человек) мужчин и женщин за ряд лет в одном городе (данные чисто гипотетические):

Год: 2000 2001 2002 2003

М: 899 1158 1214 1258

Ж: 748 713 825 927


Возможно ли доказать, что болезненность мужчин выше аналогичного показателя для женщин?

Заранее спасибо!
DrgLena
Да, можно. На каждый год доля мужчин выше, чем женщин, к разности долей посчитайте ДИ, методы уже обсуждались на форуме.
плав
Цитата(DrgLena @ 15.09.2010 - 10:33) *
Да, можно. На каждый год доля мужчин выше, чем женщин, к разности долей посчитайте ДИ, методы уже обсуждались на форуме.

Единственная проблема, надо иметь исходные (абсолютные) данные, а не как написано в посте "на 1000 человек". Если есть только доли, то сравнение не возможно.
nokh
Цитата(плав @ 15.09.2010 - 22:05) *
Единственная проблема, надо иметь исходные (абсолютные) данные, а не как написано в посте "на 1000 человек". Если есть только доли, то сравнение не возможно.

Если есть только доли, но ряд достаточно длинный, то можно привести аргумент Арбатнота. Если предположить равную болезненность мужчин и женщин (1/2), то вероятность случайным образом наблюдать большую долю мужчин 4 года подряд составит (1/2)^4=0,0625. Для ряда в 5 лет это 0,03125, что формально меньше 5%, а для 7 лет она <0,001, что уже вряд-ли случайно, т.е. маловероятно, что болезненность мужчин и женщин была равной.
плав
Цитата(nokh @ 15.09.2010 - 20:51) *
Если есть только доли, но ряд достаточно длинный, то можно привести аргумент Арбатнота. Если предположить равную болезненность мужчин и женщин (1/2), то вероятность случайным образом наблюдать большую долю мужчин 4 года подряд составит (1/2)^4=0,0625. Для ряда в 5 лет это 0,03125, что формально меньше 5%, а для 7 лет она <0,001, что уже вряд-ли случайно, т.е. маловероятно, что болезненность мужчин и женщин была равной.

Не совсем так. Подобный аргумент превращает анализ в простое упражнение в теории вероятности, но там нет тестирования. Семья, в которой подряд родилось пять девочек не опровергает предположение о том, что вероятности рождения мальчиков и девочек примерно равны (мальчиков чуть больше). Возьмите случайную выборку в 1000 семей с 5 детьми и найдете там семьи (около 3%) с пятью девочками. Опять-таки семь раз подряд выпадание красного не означает, что колесо рулетки "заряжено".
Более того, такая аргументация порождает следующую проблему. Предположим, что есть серия из 6 лет. Всегда хуже у мужчин. Вероятность 1,6%. Считаем, что вероятность равной болезненности мала, т.е. они отличаются. На седьмой год ситуация становится хуже у женщин. Вероятность серии 6+1 - 6,25%. Иными словами, болезненности не отличаются. Когда мы были правы? Теперь опустим первый год - у нас 5+1, вероятность 12,5%. Болезненности одинаковы. Нарисую всю картинку
------+
Если берут первые шесть лет - болезненность выше. Если на один год позже - болезненности одинаковы. Доказательств никаких. Более того, неизвестно, что принесут следующие один-два года.
Stefa
Спасибо большое всем за помощь.
nokh
Цитата(плав @ 16.09.2010 - 00:50) *
Не совсем так. Подобный аргумент превращает анализ в простое упражнение в теории вероятности, но там нет тестирования... Более того, неизвестно, что принесут следующие один-два года.

Логика понятна, но как тогда быть с критерием знаков? В принципе, он тоже здесь уместен, а вероятности для него рассчитываются именно по биномиальному распределению. Таблицы критических значений говорят, что вне границ [0; 5] эффект значим. Т.е. если мы имеем 6 плюсов или 6 минусов - различия статистически значимы. А что покажут дальнейшие исследования никогда не известно:)
плав
Цитата(nokh @ 21.09.2010 - 21:58) *
Логика понятна, но как тогда быть с критерием знаков? В принципе, он тоже здесь уместен, а вероятности для него рассчитываются именно по биномиальному распределению. Таблицы критических значений говорят, что вне границ [0; 5] эффект значим. Т.е. если мы имеем 6 плюсов или 6 минусов - различия статистически значимы. А что покажут дальнейшие исследования никогда не известно:)

Разница двоякая - во-первых, критерий знаков (и вообще использование биномиального распределения) предполагает случайную выборку из (бесконечно большой) "урны", иными словами каждая попытка - независимое испытание. Иными словами при взятии одного шара каждый другой шар имеет равную вероятность появиться за предыдущим. В случае годов в независимость испытаний верить сложно, поскольку после 2010 года не может следовать 1930. В случае волнообразных изменений по этой причине, результат может быть различным от периода, в котором проводится тестирование - что не могло бы наблюдаться при выполнении допущений, при которых используется критерий знаков (независимость испытаний). Во-вторых, и это более серьезно, распространенность не может рассматриваться как отдельное испытание просто по причине того, что она состоит из большого числа испытаний. Вероятность того, что за частотой 6/10 последует 4/10 значительно выше того, что за 600/1000 последует 400/10000, а в описанном ранее подходе она принимается одинаковой. На самом деле, проблема, к которой я привлек внимание, характерна для любого статистического тестирования, но резкое отбрасывание данных, как в этом примере легко приводит к серьезным противоречиям, которые не были бы столь значительными, если бы данные не были выброшены.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.