Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V  < 1 2  
Добавить ответ в эту темуОткрыть тему
> Доверительные интервалы, Необходимы ли доверительные интервалы для показателей смертности и тд.
passant
сообщение 29.11.2018 - 11:25
Сообщение #16


Дух форума
*

Группа: Пользователи
Сообщений: 139
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(paravoz @ 27.11.2018 - 14:58) *
Интересная позиция, даже вполне понятная. Я пока пытаюсь дальше поразмышлять на предмет того, может ли среднегодовая численность населения рассматриваться с той позиции, которую Вы описываете.

Даже если предположить, что такие умозаключения верны, то как быть например с таким коэффициентом. Уж простите, но это первое что пришло в голову. Коэффициент младенческой смертности = число детей, умерших в течение года на 1 году жизни / число родившихся живыми в данном году * 1000. В данном случае и числитель и знаменатель точные абсолютные величины, которые определяются на конец года. Получается ли, что для данного показателя нельзя считать ДИ.

Никак нет.
В основе развития человеческой цивилизации лежит простая человеческая лень smile.gif . Вот, когда придумывали указанный вами коэффициент именно лень его таким и сделала. Правда врачам это простительно, они людей должны лечить, а не цифры считать, но тем не менее. wink.gif
А теперь без шуток. Именно желание сократить объем работы приводит к тому, что у вас в вашем коэффициенте фигурируют "как-бы" абсолютные величины. На самом деле люди рождаются (и умирают) ежедневно. Значит на самом деле обе ваши "абсолютные величины" есть некий интегральный параметр от значений двух независимых временных рядов, полученных при отображении ежедневного количества соответственно родившихся и умерших. И единственная абсолютная, не требующая никаких доверительных интервалах цифра - это вот "сегодня, 29 ноября, в городе N родилось X младенцев и умерло Y детей до года". А как только вы переходите к рассмотрению годовых показателей - с точки зрения строгой математический статистики - будьте любезны оперировать описанием временных рядов. И в итоге снова имеем отношение случайных величин, для описания которого надо использовать его распределение (или, опять-же по ленности smile.gif - какие-то его параметры ).
На самом деле, если подумать, использование критериев типа Cтьюдента, Фишера и пр. и уж тем более - сравнение по перекрытию доверительных интервалов - идет от желания сократить расходы на вычисления. Потому что единственный "полный" метод сравнения двух случайных выборок - это критерий Смирнова (или - обычно пишут "Колмогорова-Смирнова"). Вот он корректно сравнивает две случайные величины используя их функции распределения (правда вопрос - а где их взять - математики оставляют за скобками). А все остальные критерии по сути были придуманы в виду "ленности", а в реалии - запредельной сложности расчетов в докомпьютерную эру вычислений. Ну а в медицинской статистике в момент ее зарождения - тем более такие расчеты были вне поля зрения. Вот и получаются, что - в том числе - указанные вами коэффициенты - это всего лишь приближенная оценка истинного значения (и вообще-то неизвестного нам) этого коэффициента.
Цитата(paravoz @ 27.11.2018 - 14:58) *
И второе. Если действительно можно для заболеваемости рассчитать ДИ, то что это за интервал? Ну то есть вероятное значение заболеваемости в какой совокупности он показывает? По логике вещей в генеральной. Но что, в данном случае, будет являться генеральной совокупностью?

Так в том-то и дело, что ввиду постоянной изменчивости, вы никак не можете "перебрать" все элементы этой генеральной совокупности.

Цитата(paravoz @ 27.11.2018 - 14:58) *
Пусть с математической точки зрения ДИ для заболеваемости использовать можно. Допустим (хоть я пока не совсем с этим согласен smile.gif ). Но какой в этом ДИ "физический смысл". Если у выборки из населения города посчитать средний рост и для него построить ДИ, то можно сказать, что ДИ это вероятный интервал среднего роста всего населения города. А в данном случае что будет являться этой самой генеральной совокупностью?

А я вот, как не врач, задумался, а о чем приведенный вами коэффициент детской смертности говорит, даже семантически. Ведь за год какие-то из родившихся в данном городе младенцев были перевезены в другие города, и теоретически возможно, что там и умерли. А какие-то из умерших в данном городе - родились и были привезены сюда.И какой тогда смысл этого коэффициента, о чем он говорит? А вот если его трактовать так, как я описал выше - хоть "физический смысл" становиться более-менее понятным. Но оставим эти размышления для медицинских статистиков.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 29.11.2018 - 13:22
Сообщение #17


Дух форума
*

Группа: Пользователи
Сообщений: 694
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(passant @ 29.11.2018 - 11:25) *
На самом деле, если подумать, использование критериев типа Cтьюдента, Фишера и пр. и уж тем более - сравнение по перекрытию доверительных интервалов - идет от желания сократить расходы на вычисления. Потому что единственный "полный" метод сравнения двух случайных выборок - это критерий Смирнова (или - обычно пишут "Колмогорова-Смирнова"). Вот он корректно сравнивает две случайные величины используя их функции распределения (правда вопрос - а где их взять - математики оставляют за скобками). А все остальные критерии по сути были придуманы в виду "ленности", а в реалии - запредельной сложности расчетов в докомпьютерную эру вычислений.


/меланхолично/
Чего для такую забористую чушь нести...

/справочно/
Для критерия Смирнова функции распределения не надо "брать" - критерий вычисляет их (ЭФР) "сам".
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 29.11.2018 - 15:18
Сообщение #18


Дух форума
*

Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Ок. Коллеги, сдаюсь!!! Раз уж медико-статистическая элита считает, что ДИ можно и нужно считать и только я единственный кто считает иначе, то буду считать. smile.gif smile.gif smile.gif
Спасибо всем за терпение, комментарии и глубокий мыслительный процесс!

Сообщение отредактировал paravoz - 29.11.2018 - 15:19
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 29.11.2018 - 15:27
Сообщение #19


Дух форума
*

Группа: Пользователи
Сообщений: 139
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(100$ @ 29.11.2018 - 13:22) *
/справочно/
Для критерия Смирнова функции распределения не надо "брать" - критерий вычисляет их (ЭФР) "сам".

/Еще более меланхолично/
На вход критерия Смирнова подаются две выборки, по которым вычисляется статистика Колмогорова-Смирнова, которая сравнивается с критическим значением, которое (в свою очередь) определяется из теоретических соображений. И - в конечном итоге - делается вывод, взяты-ли две исходные выборки из одной ген.совокупности или из разных. По факту он сравнивает эмпирические распределения двух выборок (не путать с критерием Колмогорова!!!)
Какую функцию распределения может вычислить критерий, призванный лишь проверить Гипотезу об однородности выборок unknw.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 29.11.2018 - 18:34
Сообщение #20


Дух форума
*

Группа: Пользователи
Сообщений: 1053
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(paravoz @ 29.11.2018 - 15:18) *
Ок. Коллеги, сдаюсь!!! Раз уж медико-статистическая элита считает, что ДИ можно и нужно считать и только я единственный кто считает иначе, то буду считать. smile.gif smile.gif smile.gif
Спасибо всем за терпение, комментарии и глубокий мыслительный процесс!



не отчаивайтесь, может через пять дет очередной заход даст больше жира


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 29.11.2018 - 18:37
Сообщение #21


Дух форума
*

Группа: Пользователи
Сообщений: 694
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(passant @ 29.11.2018 - 15:27) *
/Еще более меланхолично/
На вход критерия Смирнова подаются две выборки, по которым вычисляется статистика Колмогорова-Смирнова, которая сравнивается с критическим значением, которое (в свою очередь) определяется из теоретических соображений. И - в конечном итоге - делается вывод, взяты-ли две исходные выборки из одной ген.совокупности или из разных. По факту он сравнивает эмпирические распределения двух выборок (не путать с критерием Колмогорова!!!)
Какую функцию распределения может вычислить критерий, призванный лишь проверить Гипотезу об однородности выборок unknw.gif


Выйдите, passant, ненадолго из меланхоличного состояния и послушайте, чего скажу. Устами проф. Орлова:

с.88:
"Критерий Смирнова основан на использовании эмпирических функций распределения Fm(x) и Gn(x), построенных по первой и второй выборкам соответственно.
Значение статистики Смирнова Dm,n=sup|Fm(x)-Gn(x)| сравнивают с соответствующим критическим значением ... и по результатам сравнения принимают или отклоняют гипотезу Ho о совпадении (однородности) функций распределения." /Эконометрика: учебник для вузов.- изд. 4, дополн. и перераб. - Ростов н/Д: Феникс,2009. - 572 с./

Если вам критически важно построение эмпирических функций распределения (ЭФР, как я и написал) считать самостоятельным этапом, а не частью работы по вычислению критерия, то тогда надо писать, что на "...вход критерия Смирнова подаются две ЭФР".

Но мой пост был ровно о том, что математики ни от кого не скрывали, где надо "брать" ЭФР для критерия, это просто вы не в курсе.

P.S. И не надо благодарить, коллега. Расширять ваш кругозор для меня - удовольствие.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 29.11.2018 - 20:42
Сообщение #22


Дух форума
*

Группа: Пользователи
Сообщений: 139
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(100$ @ 29.11.2018 - 18:37) *
Выйдите, passant, ненадолго из меланхоличного состояния и послушайте, чего скажу. Устами проф. Орлова:

с.88:
"Критерий Смирнова основан на использовании эмпирических функций распределения Fm(x) и Gn(x), построенных по первой и второй выборкам соответственно.
Значение статистики Смирнова Dm,n=sup|Fm(x)-Gn(x)| сравнивают с соответствующим критическим значением ... и по результатам сравнения принимают или отклоняют гипотезу Ho о совпадении (однородности) функций распределения." /Эконометрика: учебник для вузов.- изд. 4, дополн. и перераб. - Ростов н/Д: Феникс,2009. - 572 с./

Если вам критически важно построение эмпирических функций распределения (ЭФР, как я и написал) считать самостоятельным этапом, а не частью работы по вычислению критерия, то тогда надо писать, что на "...вход критерия Смирнова подаются две ЭФР".

Но мой пост был ровно о том, что математики ни от кого не скрывали, где надо "брать" ЭФР для критерия, это просто вы не в курсе.

P.S. И не надо благодарить, коллега. Расширять ваш кругозор для меня - удовольствие.

Если бы я был первый день на формуле, ваша манера вести дискуссию, наверно, произвела бы на меня впечатление. Но увы, тем кто тут давненько - она хорошо известна. Поэтому ваши личностные выпады, от которых вы ну никак не можете воздержаться, уже ни у кого не вызывают ни удивления, ни уважения ни нервного трепета. А уж благоговения перед великим и всезнающим - тем более. Но это так, к слову.

Теперь по сути.
Во-первых, я нигде не ставил под сомнение, что критерий основан на использовании и анализе функций распределений. Я это написал в первом же сообщении. А вы меня пытаетесь убедить, что "да он основан на анализе функций распределения" еще и Орлова сюда "призвали". Зачем?

Во-вторых, то что он основан на анализе эмпирических функций распределений никак не отменяет того факта, что предназначен-то он для сравнения двух выборок. И на вход критерия именно выборки подаются. Подтверждение тому - реализация указанного критерия и в Python (модуль scipy.stats функция ks_2samp), и в R(базовая библиотека stats, функция ks.test). Думаю, если покопать - то и в других пакетах/системах будет то-же.

В-третьих, вопрос, который я действительно упоминал, заключался в том, на сколько эмпирическая функция распределения (которая используется в критерии) соответствует функции распределения данной генеральной совокупности (объективно существующей) - в данном тесте никак не изучается и не учитывается (ну, кроме зависимости от N, естественно). Я понимаю, что "математики не от кого не скрывали", а я - в отличии вас, разумеется - просто не в курсе. Может, расширите мой кругозор.

В целом, так и не понял, какой же из высказанных мной тезисов вызвал у вас такую бурную реакцию. Впрочем, бывает. Думаю, дальнейшая дискуссия в таком стиле является бессмысленной и увы, неинтересной. Посему участие в ней заканчиваю.

Сообщение отредактировал passant - 29.11.2018 - 20:45
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 29.11.2018 - 21:59
Сообщение #23


Дух форума
*

Группа: Пользователи
Сообщений: 694
Регистрация: 23.08.2010
Пользователь №: 22694




Цитата
Если бы я был первый день на формуле, ваша манера вести дискуссию, наверно, произвела бы на меня впечатление. Но увы, тем кто тут давненько - она хорошо известна. Поэтому ваши личностные выпады, от которых вы ну никак не можете воздержаться, уже ни у кого не вызывают ни удивления, ни уважения ни нервного трепета. А уж благоговения перед великим и всезнающим - тем более. Но это так, к слову.


Очередное кисо обиделось. Ни вашего впечатления, ни вашего удивления, ни вашего нервенного трепета, и, паче того, вашего благоговения - ничего из вышеперечисленного мне не требуется - я не старьевщик.


Просто не хочу, чтобы в анналах форума бережно хранились фразы типа "правда вопрос - а где их взять - математики оставляют за скобками". Никто никого в статистике не просит где-то взять и предъявить (вынь да положь!) истинные функции распределения. Достаточно того факта, что по теореме Гливенко - Кантелли эмпирическая функция распределения является состоятельной и несмещенной оценкой истинной функции распределения. И критерий Смирнова поданные на его вход выборки "перемалывает" именно в две ЭФР.

Цитата
В-третьих, вопрос, который я действительно упоминал, заключался в том, на сколько эмпирическая функция распределения (которая используется в критерии) соответствует функции распределения данной генеральной совокупности (объективно существующей) - в данном тесте никак не изучается и не учитывается (ну, кроме зависимости от N, естественно).


Именно, что учитывается. Уже хотя бы потому что теорема Гливенко - Кантелли 1933 г.р., и как только она была доказана, тотчас же Колмогоров предложил свой критерий, а Смирнов - свой.

А что такое "зависимость от N"?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 30.11.2018 - 03:06
Сообщение #24


Дух форума
*

Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(p2004r @ 29.11.2018 - 22:34) *
не отчаивайтесь, может через пять дет очередной заход даст больше жира


Хорошо, заведу такую традицию - раз в 5 лет ходить в на форум с вопросом о доверительных интервалах для смертности. smile.gif Лет через 70-80 может быть опубликую статью о динамике мнений относительного данного вопроса!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 30.11.2018 - 10:59
Сообщение #25


Дух форума
*

Группа: Пользователи
Сообщений: 1053
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(paravoz @ 30.11.2018 - 03:06) *
Хорошо, заведу такую традицию - раз в 5 лет ходить в на форум с вопросом о доверительных интервалах для смертности. smile.gif Лет через 70-80 может быть опубликую статью о динамике мнений относительного данного вопроса!


Кандидат искренне засмеялся. Но засмеялся один и почувствовал неловкость.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V  < 1 2
Добавить ответ в эту темуОткрыть тему