Выбор метода при анализе показателей заболеваемости - Форум врачей-аспирантов

Форум врачей-аспирантов

Правила форума

Пользователи

Календарь

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Добавить ответ в эту тему

Открыть тему

Выбор метода при анализе показателей заболеваемости

Stefa Просмотр профиля	15.09.2010 - 04:44 Сообщение #1
Группа: Пользователи Сообщений: 33 Регистрация: 31.07.2008 Пользователь №: 5185	Добрый день! Подскажите, пожалуйста, каким методом можно воспользоваться в данном случае, и вообще уместно ли применять какие либо методы? Есть данные по болезненности (количество обращений к врачу на 1000 человек) мужчин и женщин за ряд лет в одном городе (данные чисто гипотетические): Год: 2000 2001 2002 2003 М: 899 1158 1214 1258 Ж: 748 713 825 927 Возможно ли доказать, что болезненность мужчин выше аналогичного показателя для женщин? Заранее спасибо!

DrgLena Просмотр профиля	15.09.2010 - 09:33 Сообщение #2
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Да, можно. На каждый год доля мужчин выше, чем женщин, к разности долей посчитайте ДИ, методы уже обсуждались на форуме.

плав Просмотр профиля	15.09.2010 - 19:05 Сообщение #3
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Цитата(DrgLena @ 15.09.2010 - 10:33) Да, можно. На каждый год доля мужчин выше, чем женщин, к разности долей посчитайте ДИ, методы уже обсуждались на форуме. Единственная проблема, надо иметь исходные (абсолютные) данные, а не как написано в посте "на 1000 человек". Если есть только доли, то сравнение не возможно.

nokh Просмотр профиля	15.09.2010 - 19:51 Сообщение #4
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(плав @ 15.09.2010 - 22:05) Единственная проблема, надо иметь исходные (абсолютные) данные, а не как написано в посте "на 1000 человек". Если есть только доли, то сравнение не возможно. Если есть только доли, но ряд достаточно длинный, то можно привести аргумент Арбатнота. Если предположить равную болезненность мужчин и женщин (1/2), то вероятность случайным образом наблюдать большую долю мужчин 4 года подряд составит (1/2)^4=0,0625. Для ряда в 5 лет это 0,03125, что формально меньше 5%, а для 7 лет она <0,001, что уже вряд-ли случайно, т.е. маловероятно, что болезненность мужчин и женщин была равной. Сообщение отредактировал nokh - 15.09.2010 - 20:24

плав Просмотр профиля	15.09.2010 - 21:50 Сообщение #5
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Цитата(nokh @ 15.09.2010 - 20:51) Если есть только доли, но ряд достаточно длинный, то можно привести аргумент Арбатнота. Если предположить равную болезненность мужчин и женщин (1/2), то вероятность случайным образом наблюдать большую долю мужчин 4 года подряд составит (1/2)^4=0,0625. Для ряда в 5 лет это 0,03125, что формально меньше 5%, а для 7 лет она <0,001, что уже вряд-ли случайно, т.е. маловероятно, что болезненность мужчин и женщин была равной. Не совсем так. Подобный аргумент превращает анализ в простое упражнение в теории вероятности, но там нет тестирования. Семья, в которой подряд родилось пять девочек не опровергает предположение о том, что вероятности рождения мальчиков и девочек примерно равны (мальчиков чуть больше). Возьмите случайную выборку в 1000 семей с 5 детьми и найдете там семьи (около 3%) с пятью девочками. Опять-таки семь раз подряд выпадание красного не означает, что колесо рулетки "заряжено". Более того, такая аргументация порождает следующую проблему. Предположим, что есть серия из 6 лет. Всегда хуже у мужчин. Вероятность 1,6%. Считаем, что вероятность равной болезненности мала, т.е. они отличаются. На седьмой год ситуация становится хуже у женщин. Вероятность серии 6+1 - 6,25%. Иными словами, болезненности не отличаются. Когда мы были правы? Теперь опустим первый год - у нас 5+1, вероятность 12,5%. Болезненности одинаковы. Нарисую всю картинку ------+ Если берут первые шесть лет - болезненность выше. Если на один год позже - болезненности одинаковы. Доказательств никаких. Более того, неизвестно, что принесут следующие один-два года.

Stefa Просмотр профиля	17.09.2010 - 03:49 Сообщение #6
Группа: Пользователи Сообщений: 33 Регистрация: 31.07.2008 Пользователь №: 5185	Спасибо большое всем за помощь.

nokh Просмотр профиля	21.09.2010 - 20:58 Сообщение #7
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(плав @ 16.09.2010 - 00:50) Не совсем так. Подобный аргумент превращает анализ в простое упражнение в теории вероятности, но там нет тестирования... Более того, неизвестно, что принесут следующие один-два года. Логика понятна, но как тогда быть с критерием знаков? В принципе, он тоже здесь уместен, а вероятности для него рассчитываются именно по биномиальному распределению. Таблицы критических значений говорят, что вне границ [0; 5] эффект значим. Т.е. если мы имеем 6 плюсов или 6 минусов - различия статистически значимы. А что покажут дальнейшие исследования никогда не известно:)

плав Просмотр профиля	21.09.2010 - 21:26 Сообщение #8
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Цитата(nokh @ 21.09.2010 - 21:58) Логика понятна, но как тогда быть с критерием знаков? В принципе, он тоже здесь уместен, а вероятности для него рассчитываются именно по биномиальному распределению. Таблицы критических значений говорят, что вне границ [0; 5] эффект значим. Т.е. если мы имеем 6 плюсов или 6 минусов - различия статистически значимы. А что покажут дальнейшие исследования никогда не известно:) Разница двоякая - во-первых, критерий знаков (и вообще использование биномиального распределения) предполагает случайную выборку из (бесконечно большой) "урны", иными словами каждая попытка - независимое испытание. Иными словами при взятии одного шара каждый другой шар имеет равную вероятность появиться за предыдущим. В случае годов в независимость испытаний верить сложно, поскольку после 2010 года не может следовать 1930. В случае волнообразных изменений по этой причине, результат может быть различным от периода, в котором проводится тестирование - что не могло бы наблюдаться при выполнении допущений, при которых используется критерий знаков (независимость испытаний). Во-вторых, и это более серьезно, распространенность не может рассматриваться как отдельное испытание просто по причине того, что она состоит из большого числа испытаний. Вероятность того, что за частотой 6/10 последует 4/10 значительно выше того, что за 600/1000 последует 400/10000, а в описанном ранее подходе она принимается одинаковой. На самом деле, проблема, к которой я привлек внимание, характерна для любого статистического тестирования, но резкое отбрасывание данных, как в этом примере легко приводит к серьезным противоречиям, которые не были бы столь значительными, если бы данные не были выброшены.

« Предыдущая тема · Медицинская статистика · Следующая тема »

Добавить ответ в эту тему

Открыть тему

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Форум IP.Board © 2026 IPS, Inc.