Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V  < 1 2  
Добавить ответ в эту темуОткрыть тему
> Снова о заболеваемости и смертности
DrgLena
сообщение 16.11.2013 - 09:11
Сообщение #16


Дух форума
*

Группа: Пользователи
Сообщений: 1324
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(paravoz @ 16.11.2013 - 07:31) *
Если вы имеете данные о распространенности заболевания А только по некоторым странам Восточной Европы, а вывод собираетесь делать по всей Восточной Европе, то вы имеете дело с выборочными данными и вополне можете расчитывать меры разброса и точности (ошибку, стандартное отклонение, дисперсию или ДИ) и использовать критерии для сравнения распространенности заболевания А в Восточной Европе с другими территориями. Единственное, что наврятли набор данных подчиняется закону нормального распределения и, наврятли, целесообразно сдесь использовать критерий стьюдента.

Ну пусть это будут все страны варшавского договора smile.gif и средний индекс распространенности по западной Европе. Каждый этот индекс это результат расчета, а потому уже несет в себе большую ошибку. Эти индексы отражают очень даже среднюю заболеваемость в данном случае на 100 000 населения, а потому стьюдент, пусть дает среднее по средним, тем более, что сравнение выборки с числом реализовано в пакетах. Вряд ли в данном случае понятие СРЕДНЕЕ нужно чем то заменять. Медианы и квартили не встречала при описании распространенности.

Я предложила этот подход, поскольку так можно сравнить, например, заболеваемость в 2000 г с последующими годами, если уж очень нужно показать р. Ваш подход с демонстрацией процентов, представляется мне вполне достаточным, но ведь модно стало ЗНАЧИМОСТЬ считать даже при сравнении двух чисел.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 16.11.2013 - 18:58
Сообщение #17


Дух форума
*

Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(DrgLena @ 16.11.2013 - 14:11) *
Ну пусть это будут все страны варшавского договора smile.gif и средний индекс распространенности по западной Европе. Каждый этот индекс это результат расчета, а потому уже несет в себе большую ошибку. Эти индексы отражают очень даже среднюю заболеваемость в данном случае на 100 000 населения, а потому стьюдент, пусть дает среднее по средним, тем более, что сравнение выборки с числом реализовано в пакетах. Вряд ли в данном случае понятие СРЕДНЕЕ нужно чем то заменять. Медианы и квартили не встречала при описании распространенности.

Я предложила этот подход, поскольку так можно сравнить, например, заболеваемость в 2000 г с последующими годами, если уж очень нужно показать р. Ваш подход с демонстрацией процентов, представляется мне вполне достаточным, но ведь модно стало ЗНАЧИМОСТЬ считать даже при сравнении двух чисел.


Представление распространенности заболеваний в виде средней заболеваемости на 100000 или на 1000 является общепринятым и, я согласен, что медиана и квартили здесь врятли подойдут. Но с точки зрения математической статистики это не верно. Читая о среднем, любой специалист в статистике сразу подразумевает нормальное распределение и то, что сопутствует этому. А в данном случае это не будет соответствовать действительности.

Расчет p критерием стьюдента, думаю, все равно не является правомочным. Мне кажется, использовать необходимо непараметрические критерии.

Все это конечно обсуждаемо и является проблемой общемировых стандартов.

У меня другой вопрос. Зачем делать выводы о распространенности заболевания во всей Западной Европе по выборочным данным о распрстраненности заболевания в странах Варшавского договора? Какова может быть в данном случае нулевая и альтернативная гипотезы?

Сообщение отредактировал paravoz - 16.11.2013 - 19:13
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 16.11.2013 - 20:16
Сообщение #18


Дух форума
*

Группа: Пользователи
Сообщений: 1324
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(paravoz @ 16.11.2013 - 19:58) *
У меня другой вопрос. Зачем делать выводы о распространенности заболевания во всей Западной Европе по выборочным данным о распрстраненности заболевания в странах Варшавского договора? Какова может быть в данном случае нулевая и альтернативная гипотезы?

Нет, страны западной Европы в варшавский договор не входили smile.gif и данные о распространенности этого заболевания опубликованы и составляют 5,9 на 100 000. По странам восточной Европы, которые входили в варшавский договор имеются данные для каждой страны. Нулевая гипотеза - распространенность заболевания А в западной европе и в исследуемых странах одинакова.
Как вы предлагаете решить эту конкретную задачу, как представить результат сравнения и какие выводы можно сделать по тем данным, которые я привела.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 16.11.2013 - 21:08
Сообщение #19


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(paravoz @ 16.11.2013 - 19:58) *
Читая о среднем, любой специалист в статистике сразу подразумевает нормальное распределение и то, что сопутствует этому.


Читая о среднем, специалист в статистике сразу подразумевает математическое ожидание случайной величины (первый центральный момент ее распределения) и то, что среднее арифметическое является его (мат. ожидания) состоятельной оценкой.

Канешна, если он специалист.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 16.11.2013 - 23:55
Сообщение #20


Дух форума
*

Группа: Пользователи
Сообщений: 1324
Регистрация: 27.11.2007
Пользователь №: 4573



100$, используйте вашу энергию в мирных целях, предложите ваш вариант решения задачи про варшавский договор ?
без мат.ожидания и другого мата для медицинской публикации.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Гематолог
сообщение 17.11.2013 - 00:02
Сообщение #21


Дух форума
*

Группа: Пользователи
Сообщений: 33
Регистрация: 17.08.2009
Пользователь №: 6249



[quote name='paravoz' date='16.11.2013 - 19:58' post='16160']
Представление распространенности заболеваний в виде средней заболеваемости на 100000 или на 1000 является общепринятым и, я согласен, что медиана и квартили здесь врятли подойдут. Но с точки зрения математической статистики это не верно. Читая о среднем, любой специалист в статистике сразу подразумевает нормальное распределение и то, что сопутствует этому. А в данном случае это не будет соответствовать действительности.

Расчет p критерием стьюдента, думаю, все равно не является правомочным. Мне кажется, использовать необходимо непараметрические критерии.

Все это конечно обсуждаемо и является проблемой общемировых стандартов.

Спасибо!

Все понял.
Пересмотрел максимум литературы на этот счет.
Прикрепил для иллюстрации две диаграммы по одной из исследуемых мной нозологий.
Описывая динамику буду рассчитывать прирост и темп прироста.
Действительно, опыт применения критерия Стьюдента для заболеваемости/смертности мне не попался.
Но так же вообще не попались примеры вычисления р для различий этих показателей. :-)
Может плохо искал...

Прикрепленные файлы
Прикрепленный файл  ЛХ.pdf ( 294,02 килобайт ) Кол-во скачиваний: 178
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 17.11.2013 - 06:05
Сообщение #22


Дух форума
*

Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(Гематолог @ 17.11.2013 - 05:02) *
Все понял.
Пересмотрел максимум литературы на этот счет.
Прикрепил для иллюстрации две диаграммы по одной из исследуемых мной нозологий.
Описывая динамику буду рассчитывать прирост и темп прироста.
Действительно, опыт применения критерия Стьюдента для заболеваемости/смертности мне не попался.
Но так же вообще не попались примеры вычисления р для различий этих показателей. :-)
Может плохо искал...


Все верно. Критерий Стьюдента и другие критерии используются когда распространность оценивается по выборозным данным, что бывает крайне редко. Обычно данные официальной статистики о распространенности доступны. Поэтому нет смысла оценивать распространенность по выборочным данным.
В связи с этим и статей вы никаких не нашли. Их нет. Ну или крайне мало.

Вы верно решили использовать прирост и темп прироста.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 17.11.2013 - 12:10
Сообщение #23


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(DrgLena @ 17.11.2013 - 00:55) *
без мат.ожидания и другого мата для медицинской публикации.


Мат в общении с женщинами не практикую, даже когда приходится их ожидать
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 18.11.2013 - 16:32
Сообщение #24


Дух форума
*

Группа: Пользователи
Сообщений: 1108
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Liz @ 16.11.2013 - 11:04) *
"nokh: Он (Z-критерий) используется для... Поэтому считаю ДИ наиболее уместными.... "
Т.е., как я поняла, различие (напр, по средним) двух выборок (пусть имеем не заболеваемости, а обычные, так сказать, выборки) можно оценить двумя РАЗНЫМИ способами: с помощью подходящего критерия (первый подход), а можно с помощью ДИ (второй подход). Разрешите вопрос на понимание: КАК после получения ДИ (средних двух сравниваемых выборок) оцифровать(!) различие (получить р)? Спасибо!!

Два подхода потому и два, что при подходе с интервальным оцениванием не нужно вычислять р. Исходя из контекста задачи мы выбираем некий заранее фиксированный уровень значимости в духе Неймана - Пирсона и закладываем его в расчёт ДИ: 90%-ных, 95%-ных, 99%-ных или каких-то ещё. Если ДИ не перекрываются считаем различия значимыми в духе гибридного подхода:) Насколько я понял, в своё вермя тема с ДИ активно раскручивалась именно как возможная самодостаточная альтернатива расчёту р. Можно, конечно, поизвращаться и интерполировать такое граничное значение альфы при котором ДИ не будут перекрываться и интерпретировать его как р, но не встречал таких рекомендаций; обычно так не поступают.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 18.11.2013 - 18:22
Сообщение #25


Дух форума
*

Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(nokh @ 18.11.2013 - 21:32) *
Два подхода потому и два, что при подходе с интервальным оцениванием не нужно вычислять р. Исходя из контекста задачи мы выбираем некий заранее фиксированный уровень значимости в духе Неймана - Пирсона и закладываем его в расчёт ДИ: 90%-ных, 95%-ных, 99%-ных или каких-то ещё. Если ДИ не перекрываются считаем различия значимыми в духе гибридного подхода:) Насколько я понял, в своё вермя тема с ДИ активно раскручивалась именно как возможная самодостаточная альтернатива расчёту р. Можно, конечно, поизвращаться и интерполировать такое граничное значение альфы при котором ДИ не будут перекрываться и интерпретировать его как р, но не встречал таких рекомендаций; обычно так не поступают.


Очень важное преимущество метода ДИ перед измерением значения p, то, что с помощью ДИ можно помимо статистической значимости узнать и клиническую значимость. Это очень важно, но многими пренебрегется. Так, например, многие расчитывают значение p и оно получается высокозначимым <0,001, и делают на этом выводы, например, о разнице количества лейкоцитов в исследуемых группа. Но стоит расчитать ДИ и оказывается, что разница составляет с 95% доверительной вероятностью в 0,1-0,5 на 10^9 лейкоцитов. Такая маленькая разница не может быть уловима ни одним человеком и выводы никакой значимости для практики не имеют. Вот и получается расчитывают p, а о клинической значимости не задумываются.

В связи с тем, что с помощью ДИ можно определить клиническую значимость, я в своих работах использую и критерии и ДИ. С помощью первых я определяю точное p (это важно, потому что <0,05 или >0,05 этого мало), а с помощью ДИ определяю клиническую значимость и 95% разброс величины. Такой подход также повышает уверенность в полученных рзультатах, так как если уж и критерием и ДИ статистически значимые различия есть, то можно с большей уверенностью сказать, что они точно есть. Но тут думаю на любителя.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 19.11.2013 - 21:41
Сообщение #26


Дух форума
*

Группа: Пользователи
Сообщений: 1324
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(paravoz @ 18.11.2013 - 18:22) *
Очень важное преимущество метода ДИ перед измерением значения p, то, что с помощью ДИ можно помимо статистической значимости узнать и клиническую значимость.

Cложно согласиться с тем, что ДИ имеет отношение к понятию клинической значимости или с тем что ДИ показывает "95% разброс величины".
Если вы имеете ввиду, что при больших выборках слабые различия могут быть статистически значимыми, то для оценки величины эффекта существует такой инструмент измрения, как d Cohen's. Это обсуждалось на форуме.
ДИ к разнице средних двух групп тоже может быть построен, но он тоже будет отражать где будет находиться разница средних, но никак не отражать клиническую значимость.

Сообщение отредактировал DrgLena - 19.11.2013 - 21:42
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
TheThing
сообщение 19.11.2013 - 23:13
Сообщение #27


Дух форума
*

Группа: Пользователи
Сообщений: 116
Регистрация: 20.02.2011
Пользователь №: 23251



Цитата(DrgLena @ 19.11.2013 - 22:41) *
Cложно согласиться с тем, что ДИ имеет отношение к понятию клинической значимости или с тем что ДИ показывает "95% разброс величины".
Если вы имеете ввиду, что при больших выборках слабые различия могут быть статистически значимыми, то для оценки величины эффекта существует такой инструмент измрения, как d Cohen's. Это обсуждалось на форуме.
ДИ к разнице средних двух групп тоже может быть построен, но он тоже будет отражать где будет находиться разница средних, но никак не отражать клиническую значимость.

Наверное, имелось ввиду следующее: например, проводится стат.анализ, рассчитывается значение р, допустим р > 0.05, если мы опираемся лишь на стат.значимость и значение р, делаем вывод,что все пропало (в смысле не можем отвергнуть нулевую гипотезу wink.gif ) Мы можем использовать величину эффекта, например Hedges g, Cohen f, Cohens d, Pearson r и др (в своё время насчитал их более 30), допустим получаем значение 0,6 по Коэн d, это достаточно большая величина эффекта, то есть можно сделать вывод,что не все пропало?? Строим доверительные интервалы для d Коэна - получаем 0.2-0.9, то есть эффект может быть как очень маленьким так и большим, опять чего-то не хватает, чтобы сделать определённый вывод. Но в данном случае, доверительные интервалы помогли определить "силу" или "надёжность" наших суждений относительно величины эффекта, которая отражает практическую значимость.
Хотя в любом случае не следует забывать, что эти границы значений величин эффектов - это такие же произвольные значения, как и в случае 0,05 для р значения. Поэтому окончательные выводы о значимости своих результатов, объединив как стат.значимость так и практическую значимость, должен делать,как это не прискорбно, человек :-)

Сообщение отредактировал TheThing - 19.11.2013 - 23:15
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 20.11.2013 - 02:15
Сообщение #28


Дух форума
*

Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(DrgLena @ 20.11.2013 - 02:41) *
Cложно согласиться с тем, что ДИ имеет отношение к понятию клинической значимости или с тем что ДИ показывает "95% разброс величины".
Если вы имеете ввиду, что при больших выборках слабые различия могут быть статистически значимыми, то для оценки величины эффекта существует такой инструмент измрения, как d Cohen's. Это обсуждалось на форуме.
ДИ к разнице средних двух групп тоже может быть построен, но он тоже будет отражать где будет находиться разница средних, но никак не отражать клиническую значимость.


Очень даже легко. smile.gif ДИ действительно показывает 95% разброс величины расчитанной по выборочным данным при экстраполяции ее на генеральную совокупность. Ну так же? может не каждое слово на своем месте, но суть верна!? Величина эффекта - это стандартизованный показатель, это недостаток всех методов его определения. Получился, к примеру, d Cohen's = 0,6. И что, как мне с этими 0,6 смотреть в глаза практикующему врачу специалисту. Метод ДИ позволяет в единицах измерения конкретного показателя показать на сколько в 95% отличаются показатели двух групп. Это могут быть средние, медианы, моды, доли, ОР, ОШ и много еще чего. И мне кажется метод ДИ более нагляден, чем оценка величины эффекта. ИМХО
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Yaroslava
сообщение 17.11.2018 - 01:08
Сообщение #29


Дух форума
*

Группа: Пользователи
Сообщений: 1
Регистрация: 17.11.2018
Пользователь №: 32279



[font="Comic Sans MS"]Здравствуйте, может мой вопрос кому-то покажется глупым, но я на него не могу найти ответ на просторах интернет-ресурсов, поэтому обращаюсь за помощью))
Подскажите, пожалуйста, если я хочу провести анализ многолетней динамики заболеваемости и планирую сравнить грубый показатель заболеваемости области А за 2000 год со средне-областным показателем того же года, то как мне рассчитать этот средне-областной показатель? Это просто среднее арифметическое по областям (обл. В+ обл. Г+..../n) или другая формула? И дальше для выявления статистической разницы я намереваюсь использовать t-критерий, в котором, опять же вопрос, для сравнения использовать среднее арифметическое по количеству населения в средне-областном показателе?

Ох...надеюсь, не запутала) Заранее спасибо за ответы!))
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 19.11.2018 - 11:57
Сообщение #30


Дух форума
*

Группа: Пользователи
Сообщений: 1108
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Yaroslava @ 17.11.2018 - 03:08) *
...
Ох...надеюсь, не запутала) Заранее спасибо за ответы!))

Запутала! Если сравниваете многолетнюю динамику, то это - одни методы, если один год - другие. За один год сравнивать со средним показателем будет некорректно, т.к. данные по интересующей области А будут входить частью в полные данные. Но можно сравнить однородность заболеваемости по областям, т.е. сделать таблицу частот из двух колонок (число лиц с заболеванием, число лиц без заболевания) и числа строк, равному числу областей, и проанализировать её критериями типа хи-квадрат. Если будет значимая неоднородность - смотреть по остаткам Хабермана какие области отклонились "в плюс", какие - "в минус" от нулевой гипотезы (заболеваемость везде одинаковая). Если в качестве третьего входа в таблицу сопряжённости добавить год, то можно проанализировать сразу весь массив данных в ходе логлинейного анализа.

Сообщение отредактировал nokh - 19.11.2018 - 12:04
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V  < 1 2
Добавить ответ в эту темуОткрыть тему