Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> Снова о заболеваемости и смертности
Гематолог
сообщение 12.11.2013 - 00:47
Сообщение #1





Группа: Пользователи
Сообщений: 33
Регистрация: 17.08.2009
Пользователь №: 6249



Друзья, я знаю, что когда-то эта тема обсуждалась.
Тем не менее, нужна помощь.
Я имею данные о заболеваемости и смертности по своему региону от одного из заболеваний системы крови за 5 лет.
Будет поставлен вопрос о статистической значимости колебаний показателей между различными годами.
Я ей богу не помню, как здесь правильно поступить - представить доверительный интервал для долей или поработать с критериями.
Спасибо за подробный ответ!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 12.11.2013 - 01:17
Сообщение #2





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Доверительный интервал здесь скорее всего не поможет.
Во-первых, вы имеете генеральную совокупность (если вы будете делать выводы о регионе) и меры разброса данных, такие как стандартное отклоение и доверительный интервал, на ней не расчитываются.
Во-вторых, вы их и не сможете посчитать потому что для расчетов мер разброса показателей необходим объем выборки, а в данном случае показатель (заболеваемость) и есть объем выборки.

В общем, при анализе временных рядов используются такие показатели как прирост, темп прироста и т.д. и они являются априори точными, так как представляют собой генеральную совокупность.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 12.11.2013 - 20:15
Сообщение #3





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Я думаю, что ДИ, всё-таки можно использовать. Ведь региональные данные - только часть какой-то более крупной генеральной совокупности, скажем РФ. Это становится особенно видно, если сравнивать статистически региональные данные с общероссийскими, или с соседними регионами. Ведь численность населения известна, можно рассчитать доли и 95%-ный ДИ, например по Клопперу - Пирсону.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 12.11.2013 - 23:23
Сообщение #4





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(Гематолог @ 12.11.2013 - 00:47) *
Друзья, я знаю, что когда-то эта тема обсуждалась.

Обсуждалась и довольно подробно. Нет смысла повторять.
Можно только добавить, что недавно на форуме 5.11.2013 - 13:47
TheThing выложил калькулятор, где можно рассчитать индексы заболеваемости, а также на примере показано сравнение индексов заболеваемости во Флориде и Аляске, а также стандартизация индексов и согласование по возрастным категориям. За что ему большое спасибо!
Посмотрите два последних листа .
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Гематолог
сообщение 13.11.2013 - 12:02
Сообщение #5





Группа: Пользователи
Сообщений: 33
Регистрация: 17.08.2009
Пользователь №: 6249



Спасибо Большое всем ответившим экспертам! Посмотрю ветку, которую указывает DrgLena. На более ранних ветках попалось обсуждение про применение
Z-критерия в подобных случаях. Но, исходя из его природы и условия, думаю, это не вариант...
Спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 13.11.2013 - 15:32
Сообщение #6





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(nokh @ 13.11.2013 - 01:15) *
Я думаю, что ДИ, всё-таки можно использовать. Ведь региональные данные - только часть какой-то более крупной генеральной совокупности, скажем РФ. Это становится особенно видно, если сравнивать статистически региональные данные с общероссийскими, или с соседними регионами. Ведь численность населения известна, можно рассчитать доли и 95%-ный ДИ, например по Клопперу - Пирсону.


Доля рациональности есть, особенно в том, что ДИ расчитать можно, но это не правильно. Заболеваемость и смертность это официальные показатели санитарной статистики РФ. Они имеют конкретные методики расчета, простые, но тем не менее они эти методики имеют. У них не может быть ни ошибок, ни стандартных отклонений, ни ДИ. Если заболеваемость, например туберкулезом, равна 4 532 на 100 000 населения, то ни каких плюсов/минусов быть не должно, это официальная статистика.
Другой вопрос если вы основываете свою работу на недостатках официальной статистики.
Например, официальная заболеваемость ХОБЛ в регионе 10,2 на 1000 населения. Проводим углубленное обследование 6000 человек с ранее не установленным диагнозом ХОБЛ и среди них находим 54 больных (то есть 9 на 1000 населения). Таким образом, делаем вывод о несоответствии официальной заболеваемости 10,2 и истиной заболевемости 10,2+9=19,2 на 1000 населения. Но тем не менее никакого плюс/минуса.

А сравниваются показатели в различных регионах тоже очень просто. Регион 1 - заболеваемость ХОБЛ - 15,6 на 1000 населения, Регион 2 - 12,3 на 1000 населения. Вывод: в Регионе 1 заболеваемость ХОБЛ выше чем в Регионе 2 на 3,3 на 1000 населения. И, по-моему, этого достаточно без всяких ошибок.

С точки зрения расчета мер разброса, то население региона это не объем выборки. Вот если считать среднее по России, то при расчете ошибки среднего и ДИ число регионов России будет объемом выборки, а в случае расчетов в одном регионе такой номер не пройдет.

На самом деле, это мое личное мнение, основанное на том, что ни разу не встречался с мерами разброса для показателей официальной статистики, но вопрос интересный.

Готов вежливо подискутировать.

Сообщение отредактировал paravoz - 13.11.2013 - 15:53
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Гематолог
сообщение 13.11.2013 - 23:54
Сообщение #7





Группа: Пользователи
Сообщений: 33
Регистрация: 17.08.2009
Пользователь №: 6249



Цитата(nokh @ 12.11.2013 - 21:15) *
Я думаю, что ДИ, всё-таки можно использовать. Ведь региональные данные - только часть какой-то более крупной генеральной совокупности, скажем РФ. Это становится особенно видно, если сравнивать статистически региональные данные с общероссийскими, или с соседними регионами. Ведь численность населения известна, можно рассчитать доли и 95%-ный ДИ, например по Клопперу - Пирсону.



А для оценки РАЗЛИЧИЯ заболеваемости между различными годами (например 2011 и 2012) можно ли использовать Z-критерий?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 14.11.2013 - 09:40
Сообщение #8





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(Гематолог @ 14.11.2013 - 04:54) *
А для оценки РАЗЛИЧИЯ заболеваемости между различными годами (например 2011 и 2012) можно ли использовать Z-критерий?


Здесь не нужно никаких критериев. Если у вас заболеваемость по всему региону, то это генеральная совокупность. Если вы имеете данные по генеральной совокупности, не требуется рассчитывать никаких мер разброса и никаких критериев. Любое изменение в динамике показателей заболеваемости генеральной совокупности является достоверным, то есть 100-процентным. Можете смело говорить, что темп прироста в 2012 году по сравнению с 2011 годом составил ..., или показатель заболеваемости в 2012 году по сравнению с 2011 годом вырос на ...%. И не нужны никакие плюсы/минусы и p-шки.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Гематолог
сообщение 14.11.2013 - 22:17
Сообщение #9





Группа: Пользователи
Сообщений: 33
Регистрация: 17.08.2009
Пользователь №: 6249



Цитата(paravoz @ 14.11.2013 - 10:40) *
Здесь не нужно никаких критериев. Если у вас заболеваемость по всему региону, то это генеральная совокупность. Если вы имеете данные по генеральной совокупности, не требуется рассчитывать никаких мер разброса и никаких критериев. Любое изменение в динамике показателей заболеваемости генеральной совокупности является достоверным, то есть 100-процентным. Можете смело говорить, что темп прироста в 2012 году по сравнению с 2011 годом составил ..., или показатель заболеваемости в 2012 году по сравнению с 2011 годом вырос на ...%. И не нужны никакие плюсы/минусы и p-шки.



Спасибо, Уважаемый PARAVOZ!
Я прошел на ветку, которую мне рекомендовали выше (не Вы), с приложенным калькулятором, но увы, она совсем не по теме.
Мне не надо вычислять заболеваемость и смертность.
У меня уже ЕСТЬ эти данные.
Вопрос состоял в сравнении между годами.
Как я Вас понял при сравнении МЕЖДУ годами, я могу ограничиться разностью заболеваемостей К2-К1 и темпом прироста - (К2-К1)/К1*100% .
Но. В своем ответе Вы затронули еще одну тему - сравнение показателей со средними по России.
Наш отдел статистики как раз и предоставляет диаграммы-столбики по нашему региону по годам в сравнении со "столбиком" - СРЕДНЯЯ ЗАБОЛЕВАЕМОСТЬ (ИЛИ СМЕРТНОСТЬ) ПО РФ по годам...
Можете чуть подробнее прояснить, как КОРРЕКТНО "сравниваться" с общероссийскими данными?
Я понимаю, что здесь многое зависит от содержательной ТРАКТОВКИ.
Но вполне возможна ситуация, когда отдельный регион ОЧЕВИДНО выделяется в заболеваемости или смертности от "среднего по России" по какому-то лейкозу или раку.
Как здесь грамотно использовать математический аппарат?
Спасибо за помощь!


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 15.11.2013 - 04:26
Сообщение #10





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(Гематолог @ 15.11.2013 - 03:17) *
Спасибо, Уважаемый PARAVOZ!
Я прошел на ветку, которую мне рекомендовали выше (не Вы), с приложенным калькулятором, но увы, она совсем не по теме.
Мне не надо вычислять заболеваемость и смертность.
У меня уже ЕСТЬ эти данные.
Вопрос состоял в сравнении между годами.
Как я Вас понял при сравнении МЕЖДУ годами, я могу ограничиться разностью заболеваемостей К2-К1 и темпом прироста - (К2-К1)/К1*100% .
Но. В своем ответе Вы затронули еще одну тему - сравнение показателей со средними по России.
Наш отдел статистики как раз и предоставляет диаграммы-столбики по нашему региону по годам в сравнении со "столбиком" - СРЕДНЯЯ ЗАБОЛЕВАЕМОСТЬ (ИЛИ СМЕРТНОСТЬ) ПО РФ по годам...
Можете чуть подробнее прояснить, как КОРРЕКТНО "сравниваться" с общероссийскими данными?
Я понимаю, что здесь многое зависит от содержательной ТРАКТОВКИ.
Но вполне возможна ситуация, когда отдельный регион ОЧЕВИДНО выделяется в заболеваемости или смертности от "среднего по России" по какому-то лейкозу или раку.
Как здесь грамотно использовать математический аппарат?
Спасибо за помощь!


При сравнении со средней заболеваемостью или смертностью по РФ нужно понимать откуда она взялась. Если это данные официальной статистики со всех регионов с последующим расчетом средней заболеваемости и смертности, то это средняя заболеваемость или смертность генеральной совокупности. В таком случае вы не то чтобы можете, а должны, ограничится обычным сравнением показателей без всяких плюсов/минусов и критериев. Например, показатель заболеваемости лейкозом N края/области превышает средние показатели по РФ на ...%. И все.
В том случае если средняя заболеваемость по РФ рассчитывалась кем-то как-то анкетно или по выборочным данным, то на таких показателях основываться вообще нельзя. То есть нельзя сравнивать официальные данные по заболеваемости и смертности вашего региона с такими средними по РФ. Берите официальную статистику с сайта Росстата и работайте с ней.

Самым грамотным подходом в данном случае является сравнение двух регионов или одного региона со средними по РФ, это сравнение стандартизованной заболеваемости и смертности.
Стандартизованная заболеваемость - это заболеваемость и смертность пересчитанные в соответствии с возрастно-половой структурой населения. Понятно, что если в структуре населения региона преобладают женщины, то гинекологических заболеваний будет больше чем в регионе с преобладанием мужчин. Поэтому наиболее грамотно, если у вас в работе это является основным разделом, сравнивать стандартизованные показатели заболеваемости и смертности. Так делает ВОЗ.
Но к сожалению официальной статистики заболеваемости по полу и возрасту в России не ведется. Но она ведется по смертности. В связи с этим, заболеваемость сравниваете обычным способом, но повторюсь, что без плюсов/минусов и различных критериев. А смертность сравниваете уже стандартизованную, но опять же без плюсов/минусов и критериев.

При расчете стандартизованных показателей возникает вопрос, к какой возрастно-половой структуре приводить смертность. Если сравниваете свой регион с другим, то для удобства восприятия лучше привести смертность другого региона в соответствии с возрастно-половой структурой вашего региона. Если сравниваете с показателями по РФ, то лучше привести в соответствие со структурой РФ. Наилучшим подходом, все-таки, является приведение смертности к европейской структуре населения. Она есть на сайте ВОЗ. В таком случае вы или кто-либо другой читающий вашу работу сможете сравнивать практически со всеми странами. ВОЗ приводит данные, как правило, именно в стандартизованном в соответствии с европейской структурой населения виде.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 15.11.2013 - 13:47
Сообщение #11





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(paravoz @ 13.11.2013 - 18:32) *
На самом деле, это мое личное мнение, основанное на том, что ни разу не встречался с мерами разброса для показателей официальной статистики, но вопрос интересный.
Готов вежливо подискутировать.

К сожалению, здесь я недостаточно компетентен для дискуссий, т.к. тоже почти не сталкиваюсь с официальной статистикой. Но, в целом, я вообще скептически отношусь к замыканию задач на генеральной совокупности (ГС) и отказе от статистики. Возьмём не регион, а конкретный дом, который стоит под трубами конкретного промышленного предприятия и в котором из конкретных проживающих 500 людей 50% страдают онкологией. Раз всё конкретно, значит это - ГС. Встаёт вопрос: расселять дом или нет (вопрос не праздный, скажем в Челябинске ещё в советские времена выселили несколько домов по ул. Механической - ближайшей зоне влияния электрометаллургического комбината, раньше почти пустовали, сейчас там офисы). Для экспертизы по вопросу придётся забыть, что это - маленькая ГС, придётся ставить её в ряд с другими, оценивать вероятности (не)случайности такого положения. То же самое далее - если прогнозировать кто заболеет, кто умрёт, кто родится или нет... При любой задаче прогноза границы ГС сразу размываются во времени.
Цитата(Гематолог @ 14.11.2013 - 02:54) *
А для оценки РАЗЛИЧИЯ заболеваемости между различными годами (например 2011 и 2012) можно ли использовать Z-критерий?

Он используется для независимых выборок, а у вас они частично зависимые: преимущественно те же люди. Но только преимущественно: кто-то приехал-уехал, родился-умер. Поэтому считаю ДИ наиболее уместными. Но, как уже написал выше, на вашем поле не играю, поэтому не навязываю, ориентируйтесь на толковые работы в своей области.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 15.11.2013 - 16:15
Сообщение #12





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(nokh @ 15.11.2013 - 18:47) *
К сожалению, здесь я недостаточно компетентен для дискуссий, т.к. тоже почти не сталкиваюсь с официальной статистикой. Но, в целом, я вообще скептически отношусь к замыканию задач на генеральной совокупности (ГС) и отказе от статистики. Возьмём не регион, а конкретный дом, который стоит под трубами конкретного промышленного предприятия и в котором из конкретных проживающих 500 людей 50% страдают онкологией. Раз всё конкретно, значит это - ГС. Встаёт вопрос: расселять дом или нет (вопрос не праздный, скажем в Челябинске ещё в советские времена выселили несколько домов по ул. Механической - ближайшей зоне влияния электрометаллургического комбината, раньше почти пустовали, сейчас там офисы). Для экспертизы по вопросу придётся забыть, что это - маленькая ГС, придётся ставить её в ряд с другими, оценивать вероятности (не)случайности такого положения.


Ввели вы меня в очень долгий и тяжелый процесс размышления по этому поводу. Но тем не менее вроде сообразил.
Можно решить эту задачу несколькими способами.

Можно взять дом подальше от завода, посмотреть там сколько в структуре занимает онкология. Затем взять дом чуть дальше и опять расчитать. В общем так можно до бесконечности, все дальше и дальше. В том случае если доля онкологии в структуре заболеваемости взятых домов снижается по мере увеличения расстояния от завода, то завод оказывает онкогенное влияние. Все это без ошибок, ДИ и различных критериев.

Второй способ. Он по изящнее. Взять долю онкологии в структуре заболеваемости региона или города и сравнить с долей онкологии в структуре заболеваемости дома. Но опять без ошибок, ДИ и критериев.

Третий способ. Я бы воспользовался им. Рассчитать стандартизованную заболеваемость онкологией в регионе или городе и стандартизованную заболеваемость онкологией в доме для исключения влияния возрастно-половой структуры населения дома. Вдруг там средний возраст проживающих 95 лет. После рассчета просто сравниваем и все, опять же без ошибок, ДИ и критериев.

Конечно можно взять второй дом и посчитать, к примеру, Хи-квадратом все это дело, но по мне, так это не правильно. Сейчас попробую еще кое-как порассуждать.

Предположим мы в вашем примере берем население дома за генеральную совокупность и одновременно рассматриваем как выборку для расчета мер разброса. Далее расчитываем ошибку доли и далее ДИ с доверительной вероятностью 95%. Таким образом, у нас получается доля онкологии в структуре заболеваемости дома составляет 50+-4,38%. Что это значит? Это значит что в генеральной совокупности доля онкологии в структуре заболеваемости должна находится с 95% вероятностью в диапазоне от 45,62% до 54,38%, что противоречит тем данным, что у нас есть - доля онкологии в структуре составляет 50% и это 100-процентнов этом доме. Таким образом ДИ не может выполнить своей фунции экстраполяции результатов на генеральную совокупность, а соответственно и не требуется его расчитывать в данном случае.
Такая ситуация возникает если вы берете дом за генеральную совокупность и выборочную одновременно. Этого не может быть. Совокупность должна быть либо выборочной, либо генеральной. В случае с отдельно стоящим домом я бы его жителей принял за генеральную совокупность. Сколько раз из жителей этого дома не выбирай по 500 человек доля онкологии все равно будет составлять 50% - никакого разброса и вероятностного распределения.

Цитата(nokh @ 15.11.2013 - 18:47) *
То же самое далее - если прогнозировать кто заболеет, кто умрёт, кто родится или нет... При любой задаче прогноза границы ГС сразу размываются во времени.


При прогнозе согласен. Это ведь прогноз он не 100%, поэтому вероятностная характеристика прогнозируемых показателей должна быть расчитана и показана.

Ну вот, вроде такова логика моя в данном вопросе. Может кого-то еще подключить попробовать? Подсказывайте.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 16.11.2013 - 00:11
Сообщение #13





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(Гематолог @ 14.11.2013 - 22:17) *
Мне не надо вычислять заболеваемость и смертность.
У меня уже ЕСТЬ эти данные.
Вопрос состоял в сравнении между годами.

Распространенность заболевания А на 100.000 населения по некоторым странам восточной Европы составила
6,2
10,1
7,5
13,0
9,0
12,5
По западной Европе индекс распространенности этого заболевания составил 5,9 .
Задача сравнения среднего индекса распространенности по восточной Европе с западной Европой сводится к задаче сравнения выборки с константой по критерию стьюдента:
Средний индекс по восточной Европе 9,7 статистически значимо превышает западноевропейский 5,9 (t=3,46; р=0,018)
Нужный вам год для сравнения всех остальных вы можете выбрать аналогично.

Я сама не могу найти нужную ветку на форуме, где обсуждалась подобная тема, в частности ДИ к индексам, попытки их построить часто приводили к отрицательным значениям. Я разделяю мнение paravoz, что демонстрация динамики не обязательно должна сопровождаться критериями, процент изменения вполне демонстрирут характер изменений в распространенности.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 16.11.2013 - 06:31
Сообщение #14





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(DrgLena @ 16.11.2013 - 05:11) *
Распространенность заболевания А на 100.000 населения по некоторым странам восточной Европы составила
6,2
10,1
7,5
13,0
9,0
12,5
По западной Европе индекс распространенности этого заболевания составил 5,9 .
Задача сравнения среднего индекса распространенности по восточной Европе с западной Европой сводится к задаче сравнения выборки с константой по критерию стьюдента:
Средний индекс по восточной Европе 9,7 статистически значимо превышает западноевропейский 5,9 (t=3,46; р=0,018)
Нужный вам год для сравнения всех остальных вы можете выбрать аналогично.


Если вы имеете данные о распространенности заболевания А только по некоторым странам Восточной Европы, а вывод собираетесь делать по всей Восточной Европе, то вы имеете дело с выборочными данными и вополне можете расчитывать меры разброса и точности (ошибку, стандартное отклонение, дисперсию или ДИ) и использовать критерии для сравнения распространенности заболевания А в Восточной Европе с другими территориями. Единственное, что наврятли набор данных подчиняется закону нормального распределения и, наврятли, целесообразно сдесь использовать критерий стьюдента.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Liz
сообщение 16.11.2013 - 08:04
Сообщение #15





Группа: Ожидающие
Сообщений: 68
Регистрация: 21.01.2012
Пользователь №: 23436



"nokh: Он (Z-критерий) используется для... Поэтому считаю ДИ наиболее уместными.... "
Т.е., как я поняла, различие (напр, по средним) двух выборок (пусть имеем не заболеваемости, а обычные, так сказать, выборки) можно оценить двумя РАЗНЫМИ способами: с помощью подходящего критерия (первый подход), а можно с помощью ДИ (второй подход). Разрешите вопрос на понимание: КАК после получения ДИ (средних двух сравниваемых выборок) оцифровать(!) различие (получить р)? Спасибо!!


Signature
English is my hobby.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему