Цитата(nokh @ 15.11.2013 - 18:47)

К сожалению, здесь я недостаточно компетентен для дискуссий, т.к. тоже почти не сталкиваюсь с официальной статистикой. Но, в целом, я вообще скептически отношусь к замыканию задач на генеральной совокупности (ГС) и отказе от статистики. Возьмём не регион, а конкретный дом, который стоит под трубами конкретного промышленного предприятия и в котором из конкретных проживающих 500 людей 50% страдают онкологией. Раз всё конкретно, значит это - ГС. Встаёт вопрос: расселять дом или нет (вопрос не праздный, скажем в Челябинске ещё в советские времена выселили несколько домов по ул. Механической - ближайшей зоне влияния электрометаллургического комбината, раньше почти пустовали, сейчас там офисы). Для экспертизы по вопросу придётся забыть, что это - маленькая ГС, придётся ставить её в ряд с другими, оценивать вероятности (не)случайности такого положения.
Ввели вы меня в очень долгий и тяжелый процесс размышления по этому поводу. Но тем не менее вроде сообразил.
Можно решить эту задачу несколькими способами.
Можно взять дом подальше от завода, посмотреть там сколько в структуре занимает онкология. Затем взять дом чуть дальше и опять расчитать. В общем так можно до бесконечности, все дальше и дальше. В том случае если доля онкологии в структуре заболеваемости взятых домов снижается по мере увеличения расстояния от завода, то завод оказывает онкогенное влияние. Все это без ошибок, ДИ и различных критериев.
Второй способ. Он по изящнее. Взять долю онкологии в структуре заболеваемости региона или города и сравнить с долей онкологии в структуре заболеваемости дома. Но опять без ошибок, ДИ и критериев.
Третий способ. Я бы воспользовался им. Рассчитать стандартизованную заболеваемость онкологией в регионе или городе и стандартизованную заболеваемость онкологией в доме для исключения влияния возрастно-половой структуры населения дома. Вдруг там средний возраст проживающих 95 лет. После рассчета просто сравниваем и все, опять же без ошибок, ДИ и критериев.
Конечно можно взять второй дом и посчитать, к примеру, Хи-квадратом все это дело, но по мне, так это не правильно. Сейчас попробую еще кое-как порассуждать.
Предположим мы в вашем примере берем население дома за генеральную совокупность и одновременно рассматриваем как выборку для расчета мер разброса. Далее расчитываем ошибку доли и далее ДИ с доверительной вероятностью 95%. Таким образом, у нас получается доля онкологии в структуре заболеваемости дома составляет 50+-4,38%. Что это значит? Это значит что в генеральной совокупности доля онкологии в структуре заболеваемости должна находится с 95% вероятностью в диапазоне от 45,62% до 54,38%, что противоречит тем данным, что у нас есть - доля онкологии в структуре составляет 50% и это 100-процентнов этом доме. Таким образом ДИ не может выполнить своей фунции экстраполяции результатов на генеральную совокупность, а соответственно и не требуется его расчитывать в данном случае.
Такая ситуация возникает если вы берете дом за генеральную совокупность и выборочную одновременно. Этого не может быть. Совокупность должна быть либо выборочной, либо генеральной. В случае с отдельно стоящим домом я бы его жителей принял за генеральную совокупность. Сколько раз из жителей этого дома не выбирай по 500 человек доля онкологии все равно будет составлять 50% - никакого разброса и вероятностного распределения.
Цитата(nokh @ 15.11.2013 - 18:47)

То же самое далее - если прогнозировать кто заболеет, кто умрёт, кто родится или нет... При любой задаче прогноза границы ГС сразу размываются во времени.
При прогнозе согласен. Это ведь прогноз он не 100%, поэтому вероятностная характеристика прогнозируемых показателей должна быть расчитана и показана.
Ну вот, вроде такова логика моя в данном вопросе. Может кого-то еще подключить попробовать? Подсказывайте.