Здравствуйте, гость ( Вход | Регистрация )
26.11.2018 - 04:37
Сообщение
#1
|
|
![]() Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
Уважаемые коллеги!
Уже неоднократно сталкиваюсь с тем, что в статьях, посвященных изучению каких-либо эпидемиологических показателей (заболеваемость, смертность и т.д.), помимо самих показателей приведены какие-то значения после знаков плюс/минус. Например, смертность населения составила 20,2?0,8 на 1000 населения. Зачастую из статьи не понятно, что это за значение, но в некоторых указывается, что это либо стандартная ошибка, либо доверительный интервал. Честно говоря всегда считал, что: 1. Доверительный интервал - интервал, который показывает диапазон наиболее вероятных значений показателя в генеральной совокупности. 2. Если рассчитывается показатель смертности, например по региону, то этот показатель учитывает всю генеральную совокупность. Смертность - число умерших/среднегодовая численность населения. Если считать всех умерших выборкой, то тогда что же будет генеральной совокупностью?! В общем мне всегда казалось, что при расчете популяционных эпидемиологических показателей доверительный интервал рассчитывать не нужно. Не то чтобы не нужно, а даже некорректно. Обычно я на такие интервалы особого внимания не обращал, но сегодня рецензент на мою статью сделал замечание и предложил мне представить к показателям еще и доверительный интервал. Подскажите, действительно ли необходимо/корректно рассчитывать доверительные интервалы в таких ситуациях? Если нет, то подскажите как грамотно обосновать рецензенту это или на какую литературу сослаться? Сам я нигде прямого запрета на это не нашел. Заранее всем спасибо! |
|
|
![]() |
![]() |
![]() |
26.11.2018 - 11:57
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Рецензенту надо тактично объяснить, что доверительные интервалы строятся к параметрам распределения, но никак не к индексным величинам. Особливо, если индекс представляет собой отношение мертвых к живым, причем мертвые не являются репрезентативной выборкой из ген. совокупности живых.
|
|
|
![]() |
![]() |
27.11.2018 - 03:34
Сообщение
#3
|
|
![]() Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
Рецензенту надо тактично объяснить, что доверительные интервалы строятся к параметрам распределения, но никак не к индексным величинам. Особливо, если индекс представляет собой отношение мертвых к живым, причем мертвые не являются репрезентативной выборкой из ген. совокупности живых. Вот это и является самым сложным. Например, методика расчета доверительного интервала для показателя смертности приведена в методических материалах которые я нашел на сайте центрального НИИ организации и информатизации здравоохранения. Также в своих методических материалах представляет такую методику НИИ онклогии им. Герцена. Рецензенты ссылаясь на эти материалы и требуют чтобы мы их посчитали. Также вы написали, что доверительные интервалы строятся к параметрам распределения, но никак не к индексным величинам. Про индексные совершенно согласен - они не представляют распределение. Но даже если у нас будет какое-то распределение. Например, при расчете смертности у нас число умерших составило 18 000 человек. У нас есть данные о возрасте смерти каждого из этих 18 000 (например, по базам смертности Росстата или по реестрам ОМС). Если мы говорим о возрасте смерти 18 000 человек, то это уже будет распределение возраста смерти. Рассчитав средний возраст смерти насколько корректно/возможно в данном случае посчитать доверительный интервал для среднего возраста смерти? Естественно в таком исследовании нами изучается только лишь регион и мы не пытаемся изучать возраст смерти населения Российской Федерации только по данным одного региона (данные о смертности по одному региону явно не могут рассматриваться как выборка из смертности по России - такая выборка не репрезентативна). Как мне кажется, в данном случае доверительный интервал рассчитывать некорректно. Если средний возраст умерших в 2017 году составил 46,5 лет, то о каком интервале может идти речь, ведь я точно знаю, что он составил 46,5 лет. Пусть даже я ДИ посчитаю для среднего. Тогда что это будет за интервал. Интервал наиболее вероятного среднего возраста умерших где? в генеральной совокупности? что это за генеральная совокупность? (это больше даже вопросы не Вам, а просто ход моих рассуждений). В общем мои рассуждения приводят меня к тому, что никакие доверительные интервалы в данном случае не нужны и даже более того их расчет и представление в работе является некорректным. |
|
|
![]() |
![]() |
28.11.2018 - 02:09
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Например, при расчете смертности у нас число умерших составило 18 000 человек. У нас есть данные о возрасте смерти каждого из этих 18 000 (например, по базам смертности Росстата или по реестрам ОМС). Если мы говорим о возрасте смерти 18 000 человек, то это уже будет распределение возраста смерти. Рассчитав средний возраст смерти насколько корректно/возможно в данном случае посчитать доверительный интервал для среднего возраста смерти? Здесь все до смешного просто: 1) вы восстановили плотность этого распределения и видите, что оно унимодально, на удивление симметрично, не остро- и не плосковершинное (т.е. с эксцессом все в порядке), тяжелых хвостов не наблюдается. Вы решаете, что истинное распределение возраста смерти в некоей генсовокупности - нормальное распределение. Нормальное распределение - двухпараметрическое, и в качестве одного из параметров выступает теоретическое среднее. В силу закона больших чисел эмпирическое среднее сходятся-таки к теоретическому, причем выборочное среднее - это состоятельная, несмещенная и эффективная оценка теоретического среднего. Таким образом параметр распределения возможно состоятельно оценить по выборке. А дальше вы ищете два числа, про которые можно сказать, что они являются концами интервала, который с заданным уровнем / коэффициентом доверия накрывает истинный (неизвестный статистику) параметр распределения. С дисперсией (вторым параметром нормального распределения) все то же самое. 2) вы восстановили плотность этого распределения и у вас кровь из глаз пошла: кривое, косое, асимметричное, лептокуртичное, многомодальное с тяжелыми хвостами. Никакой подходящей аппроксимации вообще не просматривается. Вот и возникает резонный вопрос - а входит ли оно вообще к какое-либо параметрическое семейство? И, если да, то можно ли вообще эти параметры состоятельно оценить по выборке? Если нет, то в этом случае эмпирическое среднее останется лишь обобщающим статистическим показателем, а состоятельной оценкой истинного параметра распределения - нет. Ну и зачем тогда к нему лепить какой-то доверительный интервал? Касаемо, н-р, показателя смертности, ситуацию вижу так: числитель этой дроби представляет собой счетную величину, измеренную в абсолютной шкале. Ее можно отмоделировать распределением Пуассона. Знаменатель - среднегодовая численность населения, очень грубо (помесячно) = численность предыдущего периода+родившиеся в данном периоде-умершие в данном периоде. На мгновение предположим (по совету коллег), что это тоже (случайная) пуассонова величина. Тогда в полный рост встает вопрос: а как распределено отношение двух пуассоновских величин? Это распределение может зависеть от параметров, которые по выборке оценить в принципе невозможно. Далее. Пусть у нас есть временной ряд, состряпанный из ежегодных показателей смертности для конкретной территории. По методике расчета данного показателя видно, что члены это ряда не являются независимыми одинаково распределенными с.в. Ряд будет автокоррелирован, если можно так выразиться, по построению. Так вот для того, чтобы такой ряд имел хоть-какую-то познавательную ценность, в нем придется интересоваться не безусловными квантилями этого распределения, а квантилями условного распределения, условного по имеющейся предыстории. |
|
|
![]() |
![]() |
paravoz Доверительные интервалы 26.11.2018 - 04:37
p2004r Цитата(paravoz @ 26.11.2018 - 04:37)... 26.11.2018 - 10:01
paravoz Цитата(p2004r @ 26.11.2018 - 14:01) ... 27.11.2018 - 03:17
p2004r Цитата(paravoz @ 27.11.2018 - 03:17)... 27.11.2018 - 17:13
nokh Цитата(paravoz @ 26.11.2018 - 06:37)... 26.11.2018 - 12:34
paravoz Цитата(nokh @ 26.11.2018 - 16:34) Дл... 27.11.2018 - 03:53
passant Ну, если хотите рассуждений - то позвольте мне ... 27.11.2018 - 12:57
paravoz Цитата(passant @ 27.11.2018 - 16:57)... 27.11.2018 - 14:58
p2004r Цитата(paravoz @ 27.11.2018 - 14:58)... 27.11.2018 - 17:29
passant Цитата(paravoz @ 27.11.2018 - 14:58)... 29.11.2018 - 11:25
100$ Цитата(passant @ 29.11.2018 - 11:25)... 29.11.2018 - 13:22
passant Цитата(100$ @ 29.11.2018 - 13:2... 29.11.2018 - 15:27
100$ Цитата(passant @ 29.11.2018 - 15:27)... 29.11.2018 - 18:37
passant Цитата(100$ @ 29.11.2018 - 18:3... 29.11.2018 - 20:42
100$ ЦитатаЕсли бы я был первый день на формуле, ваша м... 29.11.2018 - 21:59
DrgLena Пять лет назад, paravoz, вы уже поднимали этот воп... 28.11.2018 - 01:00
paravoz Да, этот вопрос я уже поднимал 5 лет назад, но к к... 28.11.2018 - 09:19
p2004r Цитата(paravoz @ 28.11.2018 - 09:19)... 28.11.2018 - 10:12
paravoz Ок. Коллеги, сдаюсь!!! Раз уж медико-с... 29.11.2018 - 15:18
p2004r Цитата(paravoz @ 29.11.2018 - 15:18)... 29.11.2018 - 18:34
paravoz Цитата(p2004r @ 29.11.2018 - 22:34) ... 30.11.2018 - 03:06
p2004r Цитата(paravoz @ 30.11.2018 - 03:06)... 30.11.2018 - 10:59![]() ![]() |