Снова о заболеваемости и смертности |
Здравствуйте, гость ( Вход | Регистрация )
Снова о заболеваемости и смертности |
12.11.2013 - 00:47
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 33 Регистрация: 17.08.2009 Пользователь №: 6249 |
Друзья, я знаю, что когда-то эта тема обсуждалась.
Тем не менее, нужна помощь. Я имею данные о заболеваемости и смертности по своему региону от одного из заболеваний системы крови за 5 лет. Будет поставлен вопрос о статистической значимости колебаний показателей между различными годами. Я ей богу не помню, как здесь правильно поступить - представить доверительный интервал для долей или поработать с критериями. Спасибо за подробный ответ! |
|
15.11.2013 - 16:15
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
К сожалению, здесь я недостаточно компетентен для дискуссий, т.к. тоже почти не сталкиваюсь с официальной статистикой. Но, в целом, я вообще скептически отношусь к замыканию задач на генеральной совокупности (ГС) и отказе от статистики. Возьмём не регион, а конкретный дом, который стоит под трубами конкретного промышленного предприятия и в котором из конкретных проживающих 500 людей 50% страдают онкологией. Раз всё конкретно, значит это - ГС. Встаёт вопрос: расселять дом или нет (вопрос не праздный, скажем в Челябинске ещё в советские времена выселили несколько домов по ул. Механической - ближайшей зоне влияния электрометаллургического комбината, раньше почти пустовали, сейчас там офисы). Для экспертизы по вопросу придётся забыть, что это - маленькая ГС, придётся ставить её в ряд с другими, оценивать вероятности (не)случайности такого положения. Ввели вы меня в очень долгий и тяжелый процесс размышления по этому поводу. Но тем не менее вроде сообразил. Можно решить эту задачу несколькими способами. Можно взять дом подальше от завода, посмотреть там сколько в структуре занимает онкология. Затем взять дом чуть дальше и опять расчитать. В общем так можно до бесконечности, все дальше и дальше. В том случае если доля онкологии в структуре заболеваемости взятых домов снижается по мере увеличения расстояния от завода, то завод оказывает онкогенное влияние. Все это без ошибок, ДИ и различных критериев. Второй способ. Он по изящнее. Взять долю онкологии в структуре заболеваемости региона или города и сравнить с долей онкологии в структуре заболеваемости дома. Но опять без ошибок, ДИ и критериев. Третий способ. Я бы воспользовался им. Рассчитать стандартизованную заболеваемость онкологией в регионе или городе и стандартизованную заболеваемость онкологией в доме для исключения влияния возрастно-половой структуры населения дома. Вдруг там средний возраст проживающих 95 лет. После рассчета просто сравниваем и все, опять же без ошибок, ДИ и критериев. Конечно можно взять второй дом и посчитать, к примеру, Хи-квадратом все это дело, но по мне, так это не правильно. Сейчас попробую еще кое-как порассуждать. Предположим мы в вашем примере берем население дома за генеральную совокупность и одновременно рассматриваем как выборку для расчета мер разброса. Далее расчитываем ошибку доли и далее ДИ с доверительной вероятностью 95%. Таким образом, у нас получается доля онкологии в структуре заболеваемости дома составляет 50+-4,38%. Что это значит? Это значит что в генеральной совокупности доля онкологии в структуре заболеваемости должна находится с 95% вероятностью в диапазоне от 45,62% до 54,38%, что противоречит тем данным, что у нас есть - доля онкологии в структуре составляет 50% и это 100-процентнов этом доме. Таким образом ДИ не может выполнить своей фунции экстраполяции результатов на генеральную совокупность, а соответственно и не требуется его расчитывать в данном случае. Такая ситуация возникает если вы берете дом за генеральную совокупность и выборочную одновременно. Этого не может быть. Совокупность должна быть либо выборочной, либо генеральной. В случае с отдельно стоящим домом я бы его жителей принял за генеральную совокупность. Сколько раз из жителей этого дома не выбирай по 500 человек доля онкологии все равно будет составлять 50% - никакого разброса и вероятностного распределения. То же самое далее - если прогнозировать кто заболеет, кто умрёт, кто родится или нет... При любой задаче прогноза границы ГС сразу размываются во времени. При прогнозе согласен. Это ведь прогноз он не 100%, поэтому вероятностная характеристика прогнозируемых показателей должна быть расчитана и показана. Ну вот, вроде такова логика моя в данном вопросе. Может кого-то еще подключить попробовать? Подсказывайте. |
|