Здравствуйте, гость ( Вход | Регистрация )
26.11.2018 - 04:37
Сообщение
#1
|
|
![]() Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
Уважаемые коллеги!
Уже неоднократно сталкиваюсь с тем, что в статьях, посвященных изучению каких-либо эпидемиологических показателей (заболеваемость, смертность и т.д.), помимо самих показателей приведены какие-то значения после знаков плюс/минус. Например, смертность населения составила 20,2?0,8 на 1000 населения. Зачастую из статьи не понятно, что это за значение, но в некоторых указывается, что это либо стандартная ошибка, либо доверительный интервал. Честно говоря всегда считал, что: 1. Доверительный интервал - интервал, который показывает диапазон наиболее вероятных значений показателя в генеральной совокупности. 2. Если рассчитывается показатель смертности, например по региону, то этот показатель учитывает всю генеральную совокупность. Смертность - число умерших/среднегодовая численность населения. Если считать всех умерших выборкой, то тогда что же будет генеральной совокупностью?! В общем мне всегда казалось, что при расчете популяционных эпидемиологических показателей доверительный интервал рассчитывать не нужно. Не то чтобы не нужно, а даже некорректно. Обычно я на такие интервалы особого внимания не обращал, но сегодня рецензент на мою статью сделал замечание и предложил мне представить к показателям еще и доверительный интервал. Подскажите, действительно ли необходимо/корректно рассчитывать доверительные интервалы в таких ситуациях? Если нет, то подскажите как грамотно обосновать рецензенту это или на какую литературу сослаться? Сам я нигде прямого запрета на это не нашел. Заранее всем спасибо! |
|
|
![]() |
![]() |
![]() |
27.11.2018 - 12:57
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Ну, если хотите рассуждений
1. "Неужели без дополнительных математических расчетов (ДИ или стат. критерии) я не могу сделать вывод о том, что в каком-то конкретном году заболеваемость в конкретном населенном пункте 2 больше, чем заболеваемость в населенном пункте 1". - по моему мнению, не можете. Все что вы корректно математически можете сказать - это "За год в населенном пункте Х заболело на 2 человека больше, чем в населенном пункте Y". Вы даже можете сказать, что "количество заболевших в городе Х было в два раза больше, чем в городе Y". Но именно так "(абсолютное) Количество заболевших" - и не более того. Потому что, говоря математическим языком, ваши данные измерены в абсолютной шкале. И все остальные операции (а ваши заключения и есть некие операции с математической точки зрения) над данными, измеренными в шкалах данного класса будут некорректными. (Кстати, к статистике это не имеет никакого отношения, эти свойства и ограничения изучает другой раздел математики -"Теория измерений"). А уж тем более, вы не можете сделать никакого "углубленного анализа " например, не можете сказать, что медучреждение в одном из пунктов работают лучше, чем во втором. 2. Для того, чтобы корректно сделать такой анализ надо перейти от непосредственно измеренных параметров к косвенно измеренным параметрам, представленным в другой шкале измерений - например, в шкале отношений. Именно для этого вместо параметра "количество заболевших" вводят и анализируют параметр "уровень заболеваемости" - рассчитываемый как отношение количества заболевших к населению. Но вот тут загвоздка. Начнем с того, что "население города" - постоянно только в течении.... одного дня (а в реальности - и того меньше)! Таким образом, если нарисовать график количества людей, проживающих в городе по дням - это будет типичный временной ряд. Причем вовсе не обязательно даже стационарный, и скорее всего - не подчиняющийся нормальному закону распределения. То есть "население города" - это случайная величина, изменяющаяся ежедневно (кто-то приехал, кто-то уехал, кто-то родился, кто-то умер т.д.). Как любая случайная величина, на конечном временном отрезке (например - год) эти данные могут быть статистически ОЦЕНЕНЫ. Другими словами, параметр "среднегодовое население" - это случайная величина, котороя, естественно, имеет и среднее, и среднеквадратичное отклонение, и доверительный интервал при заданном уровне значимости и даже (хотя-бы теоретически) коэффициенты автокорреляции различных порядков. И никакое другое представление (например - точечная оценка) не является для нее математически полным. 3. Если вы какой-то параметр-константу (количество заболевших за год) делите на параметр-ОЦЕНКУ случайной величины (среднее население города за год), то результат будет -случайная величина (измеренная в более слабой из шкал). Со всеми ее необходимыми атрибутами, включая доверительные интервалы. И именно с такими данными вы уже реально можете проводить какие-то дальнейшие исследования или анализ - и сравнивать по разным регионам, и анализировать в плане исторического изменения, и делать предсказания и пр. пр. пр. 4. Вывод. "Количество заболевших" - никаких ДИ, достаточно непосредственно измеренных абсолютных данных. Но ограниченные возможности анализа и интерпретации. А вот "уровень заболеваемости" - статистическая величина с необходимым интервальным представлением параметров. Зато полная свобода для дальнейшего анализа. Вот как-то так. Не знаю, удалось-ли мне хоть немного "популяризировать" математику, но я старался Сообщение отредактировал passant - 27.11.2018 - 13:05 |
|
|
![]() |
![]() |
27.11.2018 - 14:58
Сообщение
#3
|
|
![]() Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
4. Вывод. "Количество заболевших" - никаких ДИ, достаточно непосредственно измеренных абсолютных данных. Но ограниченные возможности анализа и интерпретации. А вот "уровень заболеваемости" - статистическая величина с необходимым интервальным представлением параметров. Зато полная свобода для дальнейшего анализа. Вот как-то так. Не знаю, удалось-ли мне хоть немного "популяризировать" математику, но я старался Интересная позиция, даже вполне понятная. Я пока пытаюсь дальше поразмышлять на предмет того, может ли среднегодовая численность населения рассматриваться с той позиции, которую Вы описываете. Даже если предположить, что такие умозаключения верны, то как быть например с таким коэффициентом. Уж простите, но это первое что пришло в голову. Коэффициент младенческой смертности = число детей, умерших в течение года на 1 году жизни / число родившихся живыми в данном году * 1000. В данном случае и числитель и знаменатель точные абсолютные величины, которые определяются на конец года. Получается ли, что для данного показателя нельзя считать ДИ. И второе. Если действительно можно для заболеваемости рассчитать ДИ, то что это за интервал? Ну то есть вероятное значение заболеваемости в какой совокупности он показывает? По логике вещей в генеральной. Но что, в данном случае, будет являться генеральной совокупностью? Я к чему. Пусть с математической точки зрения ДИ для заболеваемости использовать можно. Допустим (хоть я пока не совсем с этим согласен PS. Вами действительно высказана интересная позиция, но, правда, пока не могу понять как ее принять. |
|
|
![]() |
![]() |
paravoz Доверительные интервалы 26.11.2018 - 04:37
p2004r Цитата(paravoz @ 26.11.2018 - 04:37)... 26.11.2018 - 10:01
paravoz Цитата(p2004r @ 26.11.2018 - 14:01) ... 27.11.2018 - 03:17
p2004r Цитата(paravoz @ 27.11.2018 - 03:17)... 27.11.2018 - 17:13
100$ Рецензенту надо тактично объяснить, что доверитель... 26.11.2018 - 11:57
paravoz Цитата(100$ @ 26.11.2018 - 15:5... 27.11.2018 - 03:34
100$ Цитата(paravoz @ 27.11.2018 - 03:34)... 28.11.2018 - 02:09
nokh Цитата(paravoz @ 26.11.2018 - 06:37)... 26.11.2018 - 12:34
paravoz Цитата(nokh @ 26.11.2018 - 16:34) Дл... 27.11.2018 - 03:53
p2004r Цитата(paravoz @ 27.11.2018 - 14:58)... 27.11.2018 - 17:29
passant Цитата(paravoz @ 27.11.2018 - 14:58)... 29.11.2018 - 11:25
100$ Цитата(passant @ 29.11.2018 - 11:25)... 29.11.2018 - 13:22
passant Цитата(100$ @ 29.11.2018 - 13:2... 29.11.2018 - 15:27
100$ Цитата(passant @ 29.11.2018 - 15:27)... 29.11.2018 - 18:37
passant Цитата(100$ @ 29.11.2018 - 18:3... 29.11.2018 - 20:42
100$ ЦитатаЕсли бы я был первый день на формуле, ваша м... 29.11.2018 - 21:59
DrgLena Пять лет назад, paravoz, вы уже поднимали этот воп... 28.11.2018 - 01:00
paravoz Да, этот вопрос я уже поднимал 5 лет назад, но к к... 28.11.2018 - 09:19
p2004r Цитата(paravoz @ 28.11.2018 - 09:19)... 28.11.2018 - 10:12
paravoz Ок. Коллеги, сдаюсь!!! Раз уж медико-с... 29.11.2018 - 15:18
p2004r Цитата(paravoz @ 29.11.2018 - 15:18)... 29.11.2018 - 18:34
paravoz Цитата(p2004r @ 29.11.2018 - 22:34) ... 30.11.2018 - 03:06
p2004r Цитата(paravoz @ 30.11.2018 - 03:06)... 30.11.2018 - 10:59![]() ![]() |