![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() ![]() |
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 33 Регистрация: 31.07.2008 Пользователь №: 5185 ![]() |
Добрый день!
Подскажите, пожалуйста, каким методом можно воспользоваться в данном случае, и вообще уместно ли применять какие либо методы? Есть данные по болезненности (количество обращений к врачу на 1000 человек) мужчин и женщин за ряд лет в одном городе (данные чисто гипотетические): Год: 2000 2001 2002 2003 М: 899 1158 1214 1258 Ж: 748 713 825 927 Возможно ли доказать, что болезненность мужчин выше аналогичного показателя для женщин? Заранее спасибо! |
|
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 ![]() |
Да, можно. На каждый год доля мужчин выше, чем женщин, к разности долей посчитайте ДИ, методы уже обсуждались на форуме.
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Да, можно. На каждый год доля мужчин выше, чем женщин, к разности долей посчитайте ДИ, методы уже обсуждались на форуме. Единственная проблема, надо иметь исходные (абсолютные) данные, а не как написано в посте "на 1000 человек". Если есть только доли, то сравнение не возможно. |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Единственная проблема, надо иметь исходные (абсолютные) данные, а не как написано в посте "на 1000 человек". Если есть только доли, то сравнение не возможно. Если есть только доли, но ряд достаточно длинный, то можно привести аргумент Арбатнота. Если предположить равную болезненность мужчин и женщин (1/2), то вероятность случайным образом наблюдать большую долю мужчин 4 года подряд составит (1/2)^4=0,0625. Для ряда в 5 лет это 0,03125, что формально меньше 5%, а для 7 лет она <0,001, что уже вряд-ли случайно, т.е. маловероятно, что болезненность мужчин и женщин была равной. Сообщение отредактировал nokh - 15.09.2010 - 20:24 |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Если есть только доли, но ряд достаточно длинный, то можно привести аргумент Арбатнота. Если предположить равную болезненность мужчин и женщин (1/2), то вероятность случайным образом наблюдать большую долю мужчин 4 года подряд составит (1/2)^4=0,0625. Для ряда в 5 лет это 0,03125, что формально меньше 5%, а для 7 лет она <0,001, что уже вряд-ли случайно, т.е. маловероятно, что болезненность мужчин и женщин была равной. Не совсем так. Подобный аргумент превращает анализ в простое упражнение в теории вероятности, но там нет тестирования. Семья, в которой подряд родилось пять девочек не опровергает предположение о том, что вероятности рождения мальчиков и девочек примерно равны (мальчиков чуть больше). Возьмите случайную выборку в 1000 семей с 5 детьми и найдете там семьи (около 3%) с пятью девочками. Опять-таки семь раз подряд выпадание красного не означает, что колесо рулетки "заряжено". Более того, такая аргументация порождает следующую проблему. Предположим, что есть серия из 6 лет. Всегда хуже у мужчин. Вероятность 1,6%. Считаем, что вероятность равной болезненности мала, т.е. они отличаются. На седьмой год ситуация становится хуже у женщин. Вероятность серии 6+1 - 6,25%. Иными словами, болезненности не отличаются. Когда мы были правы? Теперь опустим первый год - у нас 5+1, вероятность 12,5%. Болезненности одинаковы. Нарисую всю картинку ------+ Если берут первые шесть лет - болезненность выше. Если на один год позже - болезненности одинаковы. Доказательств никаких. Более того, неизвестно, что принесут следующие один-два года. |
|
![]() |
![]() |
![]()
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 33 Регистрация: 31.07.2008 Пользователь №: 5185 ![]() |
Спасибо большое всем за помощь.
|
|
![]() |
![]() |
![]()
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Не совсем так. Подобный аргумент превращает анализ в простое упражнение в теории вероятности, но там нет тестирования... Более того, неизвестно, что принесут следующие один-два года. Логика понятна, но как тогда быть с критерием знаков? В принципе, он тоже здесь уместен, а вероятности для него рассчитываются именно по биномиальному распределению. Таблицы критических значений говорят, что вне границ [0; 5] эффект значим. Т.е. если мы имеем 6 плюсов или 6 минусов - различия статистически значимы. А что покажут дальнейшие исследования никогда не известно:) |
|
![]() |
![]() |
![]()
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Логика понятна, но как тогда быть с критерием знаков? В принципе, он тоже здесь уместен, а вероятности для него рассчитываются именно по биномиальному распределению. Таблицы критических значений говорят, что вне границ [0; 5] эффект значим. Т.е. если мы имеем 6 плюсов или 6 минусов - различия статистически значимы. А что покажут дальнейшие исследования никогда не известно:) Разница двоякая - во-первых, критерий знаков (и вообще использование биномиального распределения) предполагает случайную выборку из (бесконечно большой) "урны", иными словами каждая попытка - независимое испытание. Иными словами при взятии одного шара каждый другой шар имеет равную вероятность появиться за предыдущим. В случае годов в независимость испытаний верить сложно, поскольку после 2010 года не может следовать 1930. В случае волнообразных изменений по этой причине, результат может быть различным от периода, в котором проводится тестирование - что не могло бы наблюдаться при выполнении допущений, при которых используется критерий знаков (независимость испытаний). Во-вторых, и это более серьезно, распространенность не может рассматриваться как отдельное испытание просто по причине того, что она состоит из большого числа испытаний. Вероятность того, что за частотой 6/10 последует 4/10 значительно выше того, что за 600/1000 последует 400/10000, а в описанном ранее подходе она принимается одинаковой. На самом деле, проблема, к которой я привлек внимание, характерна для любого статистического тестирования, но резкое отбрасывание данных, как в этом примере легко приводит к серьезным противоречиям, которые не были бы столь значительными, если бы данные не были выброшены. |
|
![]() |
![]() |
![]() ![]() |