Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Доверительные интервалы, Необходимы ли доверительные интервалы для показателей смертности и тд.
paravoz
сообщение 26.11.2018 - 04:37
Сообщение #1





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Уважаемые коллеги!

Уже неоднократно сталкиваюсь с тем, что в статьях, посвященных изучению каких-либо эпидемиологических показателей (заболеваемость, смертность и т.д.), помимо самих показателей приведены какие-то значения после знаков плюс/минус. Например, смертность населения составила 20,2?0,8 на 1000 населения.
Зачастую из статьи не понятно, что это за значение, но в некоторых указывается, что это либо стандартная ошибка, либо доверительный интервал.
Честно говоря всегда считал, что:
1. Доверительный интервал - интервал, который показывает диапазон наиболее вероятных значений показателя в генеральной совокупности.
2. Если рассчитывается показатель смертности, например по региону, то этот показатель учитывает всю генеральную совокупность.

Смертность - число умерших/среднегодовая численность населения. Если считать всех умерших выборкой, то тогда что же будет генеральной совокупностью?!
В общем мне всегда казалось, что при расчете популяционных эпидемиологических показателей доверительный интервал рассчитывать не нужно. Не то чтобы не нужно, а даже некорректно. Обычно я на такие интервалы особого внимания не обращал, но сегодня рецензент на мою статью сделал замечание и предложил мне представить к показателям еще и доверительный интервал.

Подскажите, действительно ли необходимо/корректно рассчитывать доверительные интервалы в таких ситуациях? Если нет, то подскажите как грамотно обосновать рецензенту это или на какую литературу сослаться? Сам я нигде прямого запрета на это не нашел. Заранее всем спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
passant
сообщение 27.11.2018 - 12:57
Сообщение #2





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Ну, если хотите рассуждений smile.gif - то позвольте мне вклинится в ваш медицинский спор. На самом деле есть много причин, по которым интервальная оценка показателя типа "заболеваемость" является необходимой - в том числе и те, которые тут уже упоминали. Но я попробую привести еще одно обоснование, причем попробую объяснить "математически, но просто" rolleyes.gif .

1. "Неужели без дополнительных математических расчетов (ДИ или стат. критерии) я не могу сделать вывод о том, что в каком-то конкретном году заболеваемость в конкретном населенном пункте 2 больше, чем заболеваемость в населенном пункте 1". - по моему мнению, не можете. Все что вы корректно математически можете сказать - это "За год в населенном пункте Х заболело на 2 человека больше, чем в населенном пункте Y". Вы даже можете сказать, что "количество заболевших в городе Х было в два раза больше, чем в городе Y". Но именно так "(абсолютное) Количество заболевших" - и не более того. Потому что, говоря математическим языком, ваши данные измерены в абсолютной шкале. И все остальные операции (а ваши заключения и есть некие операции с математической точки зрения) над данными, измеренными в шкалах данного класса будут некорректными. (Кстати, к статистике это не имеет никакого отношения, эти свойства и ограничения изучает другой раздел математики -"Теория измерений"). А уж тем более, вы не можете сделать никакого "углубленного анализа " например, не можете сказать, что медучреждение в одном из пунктов работают лучше, чем во втором.
2. Для того, чтобы корректно сделать такой анализ надо перейти от непосредственно измеренных параметров к косвенно измеренным параметрам, представленным в другой шкале измерений - например, в шкале отношений. Именно для этого вместо параметра "количество заболевших" вводят и анализируют параметр "уровень заболеваемости" - рассчитываемый как отношение количества заболевших к населению. Но вот тут загвоздка. Начнем с того, что "население города" - постоянно только в течении.... одного дня (а в реальности - и того меньше)! Таким образом, если нарисовать график количества людей, проживающих в городе по дням - это будет типичный временной ряд. Причем вовсе не обязательно даже стационарный, и скорее всего - не подчиняющийся нормальному закону распределения. То есть "население города" - это случайная величина, изменяющаяся ежедневно (кто-то приехал, кто-то уехал, кто-то родился, кто-то умер т.д.). Как любая случайная величина, на конечном временном отрезке (например - год) эти данные могут быть статистически ОЦЕНЕНЫ. Другими словами, параметр "среднегодовое население" - это случайная величина, котороя, естественно, имеет и среднее, и среднеквадратичное отклонение, и доверительный интервал при заданном уровне значимости и даже (хотя-бы теоретически) коэффициенты автокорреляции различных порядков. И никакое другое представление (например - точечная оценка) не является для нее математически полным.
3. Если вы какой-то параметр-константу (количество заболевших за год) делите на параметр-ОЦЕНКУ случайной величины (среднее население города за год), то результат будет -случайная величина (измеренная в более слабой из шкал). Со всеми ее необходимыми атрибутами, включая доверительные интервалы. И именно с такими данными вы уже реально можете проводить какие-то дальнейшие исследования или анализ - и сравнивать по разным регионам, и анализировать в плане исторического изменения, и делать предсказания и пр. пр. пр.
4. Вывод. "Количество заболевших" - никаких ДИ, достаточно непосредственно измеренных абсолютных данных. Но ограниченные возможности анализа и интерпретации. А вот "уровень заболеваемости" - статистическая величина с необходимым интервальным представлением параметров. Зато полная свобода для дальнейшего анализа.

Вот как-то так. Не знаю, удалось-ли мне хоть немного "популяризировать" математику, но я старался rolleyes.gif

Сообщение отредактировал passant - 27.11.2018 - 13:05
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 27.11.2018 - 14:58
Сообщение #3





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(passant @ 27.11.2018 - 16:57) *
4. Вывод. "Количество заболевших" - никаких ДИ, достаточно непосредственно измеренных абсолютных данных. Но ограниченные возможности анализа и интерпретации. А вот "уровень заболеваемости" - статистическая величина с необходимым интервальным представлением параметров. Зато полная свобода для дальнейшего анализа.

Вот как-то так. Не знаю, удалось-ли мне хоть немного "популяризировать" математику, но я старался rolleyes.gif


Интересная позиция, даже вполне понятная. Я пока пытаюсь дальше поразмышлять на предмет того, может ли среднегодовая численность населения рассматриваться с той позиции, которую Вы описываете.

Даже если предположить, что такие умозаключения верны, то как быть например с таким коэффициентом. Уж простите, но это первое что пришло в голову. Коэффициент младенческой смертности = число детей, умерших в течение года на 1 году жизни / число родившихся живыми в данном году * 1000. В данном случае и числитель и знаменатель точные абсолютные величины, которые определяются на конец года. Получается ли, что для данного показателя нельзя считать ДИ.

И второе. Если действительно можно для заболеваемости рассчитать ДИ, то что это за интервал? Ну то есть вероятное значение заболеваемости в какой совокупности он показывает? По логике вещей в генеральной. Но что, в данном случае, будет являться генеральной совокупностью?
Я к чему. Пусть с математической точки зрения ДИ для заболеваемости использовать можно. Допустим (хоть я пока не совсем с этим согласен smile.gif ). Но какой в этом ДИ "физический смысл". Если у выборки из населения города посчитать средний рост и для него построить ДИ, то можно сказать, что ДИ это вероятный интервал среднего роста всего населения города. А в данном случае что будет являться этой самой генеральной совокупностью?

PS. Вами действительно высказана интересная позиция, но, правда, пока не могу понять как ее принять. smile.gif smile.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 29.11.2018 - 11:25
Сообщение #4





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(paravoz @ 27.11.2018 - 14:58) *
Интересная позиция, даже вполне понятная. Я пока пытаюсь дальше поразмышлять на предмет того, может ли среднегодовая численность населения рассматриваться с той позиции, которую Вы описываете.

Даже если предположить, что такие умозаключения верны, то как быть например с таким коэффициентом. Уж простите, но это первое что пришло в голову. Коэффициент младенческой смертности = число детей, умерших в течение года на 1 году жизни / число родившихся живыми в данном году * 1000. В данном случае и числитель и знаменатель точные абсолютные величины, которые определяются на конец года. Получается ли, что для данного показателя нельзя считать ДИ.

Никак нет.
В основе развития человеческой цивилизации лежит простая человеческая лень smile.gif . Вот, когда придумывали указанный вами коэффициент именно лень его таким и сделала. Правда врачам это простительно, они людей должны лечить, а не цифры считать, но тем не менее. wink.gif
А теперь без шуток. Именно желание сократить объем работы приводит к тому, что у вас в вашем коэффициенте фигурируют "как-бы" абсолютные величины. На самом деле люди рождаются (и умирают) ежедневно. Значит на самом деле обе ваши "абсолютные величины" есть некий интегральный параметр от значений двух независимых временных рядов, полученных при отображении ежедневного количества соответственно родившихся и умерших. И единственная абсолютная, не требующая никаких доверительных интервалах цифра - это вот "сегодня, 29 ноября, в городе N родилось X младенцев и умерло Y детей до года". А как только вы переходите к рассмотрению годовых показателей - с точки зрения строгой математический статистики - будьте любезны оперировать описанием временных рядов. И в итоге снова имеем отношение случайных величин, для описания которого надо использовать его распределение (или, опять-же по ленности smile.gif - какие-то его параметры ).
На самом деле, если подумать, использование критериев типа Cтьюдента, Фишера и пр. и уж тем более - сравнение по перекрытию доверительных интервалов - идет от желания сократить расходы на вычисления. Потому что единственный "полный" метод сравнения двух случайных выборок - это критерий Смирнова (или - обычно пишут "Колмогорова-Смирнова"). Вот он корректно сравнивает две случайные величины используя их функции распределения (правда вопрос - а где их взять - математики оставляют за скобками). А все остальные критерии по сути были придуманы в виду "ленности", а в реалии - запредельной сложности расчетов в докомпьютерную эру вычислений. Ну а в медицинской статистике в момент ее зарождения - тем более такие расчеты были вне поля зрения. Вот и получаются, что - в том числе - указанные вами коэффициенты - это всего лишь приближенная оценка истинного значения (и вообще-то неизвестного нам) этого коэффициента.
Цитата(paravoz @ 27.11.2018 - 14:58) *
И второе. Если действительно можно для заболеваемости рассчитать ДИ, то что это за интервал? Ну то есть вероятное значение заболеваемости в какой совокупности он показывает? По логике вещей в генеральной. Но что, в данном случае, будет являться генеральной совокупностью?

Так в том-то и дело, что ввиду постоянной изменчивости, вы никак не можете "перебрать" все элементы этой генеральной совокупности.

Цитата(paravoz @ 27.11.2018 - 14:58) *
Пусть с математической точки зрения ДИ для заболеваемости использовать можно. Допустим (хоть я пока не совсем с этим согласен smile.gif ). Но какой в этом ДИ "физический смысл". Если у выборки из населения города посчитать средний рост и для него построить ДИ, то можно сказать, что ДИ это вероятный интервал среднего роста всего населения города. А в данном случае что будет являться этой самой генеральной совокупностью?

А я вот, как не врач, задумался, а о чем приведенный вами коэффициент детской смертности говорит, даже семантически. Ведь за год какие-то из родившихся в данном городе младенцев были перевезены в другие города, и теоретически возможно, что там и умерли. А какие-то из умерших в данном городе - родились и были привезены сюда.И какой тогда смысл этого коэффициента, о чем он говорит? А вот если его трактовать так, как я описал выше - хоть "физический смысл" становиться более-менее понятным. Но оставим эти размышления для медицинских статистиков.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- paravoz   Доверительные интервалы   26.11.2018 - 04:37
- - p2004r   Цитата(paravoz @ 26.11.2018 - 04:37)...   26.11.2018 - 10:01
|- - paravoz   Цитата(p2004r @ 26.11.2018 - 14:01) ...   27.11.2018 - 03:17
|- - p2004r   Цитата(paravoz @ 27.11.2018 - 03:17)...   27.11.2018 - 17:13
- - 100$   Рецензенту надо тактично объяснить, что доверитель...   26.11.2018 - 11:57
|- - paravoz   Цитата(100$ @ 26.11.2018 - 15:5...   27.11.2018 - 03:34
|- - 100$   Цитата(paravoz @ 27.11.2018 - 03:34)...   28.11.2018 - 02:09
- - nokh   Цитата(paravoz @ 26.11.2018 - 06:37)...   26.11.2018 - 12:34
|- - paravoz   Цитата(nokh @ 26.11.2018 - 16:34) Дл...   27.11.2018 - 03:53
- - passant   Ну, если хотите рассуждений - то позвольте мне ...   27.11.2018 - 12:57
|- - paravoz   Цитата(passant @ 27.11.2018 - 16:57)...   27.11.2018 - 14:58
|- - p2004r   Цитата(paravoz @ 27.11.2018 - 14:58)...   27.11.2018 - 17:29
|- - passant   Цитата(paravoz @ 27.11.2018 - 14:58)...   29.11.2018 - 11:25
|- - 100$   Цитата(passant @ 29.11.2018 - 11:25)...   29.11.2018 - 13:22
|- - passant   Цитата(100$ @ 29.11.2018 - 13:2...   29.11.2018 - 15:27
|- - 100$   Цитата(passant @ 29.11.2018 - 15:27)...   29.11.2018 - 18:37
|- - passant   Цитата(100$ @ 29.11.2018 - 18:3...   29.11.2018 - 20:42
|- - 100$   ЦитатаЕсли бы я был первый день на формуле, ваша м...   29.11.2018 - 21:59
- - DrgLena   Пять лет назад, paravoz, вы уже поднимали этот воп...   28.11.2018 - 01:00
- - paravoz   Да, этот вопрос я уже поднимал 5 лет назад, но к к...   28.11.2018 - 09:19
|- - p2004r   Цитата(paravoz @ 28.11.2018 - 09:19)...   28.11.2018 - 10:12
- - paravoz   Ок. Коллеги, сдаюсь!!! Раз уж медико-с...   29.11.2018 - 15:18
- - p2004r   Цитата(paravoz @ 29.11.2018 - 15:18)...   29.11.2018 - 18:34
- - paravoz   Цитата(p2004r @ 29.11.2018 - 22:34) ...   30.11.2018 - 03:06
- - p2004r   Цитата(paravoz @ 30.11.2018 - 03:06)...   30.11.2018 - 10:59


Добавить ответ в эту темуОткрыть тему