Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

42 страниц V   1 2 3 > » 

p2004r
Отправлено: 8.09.2019 - 19:17


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(p2004r @ 3.09.2019 - 21:22) *
А неплохо ("естественные группировки" он за корреляции не признает, что вполне даже логично и хорошо для разборок с ложными к.к.)


А вообще сосет sad.gif

> HellCor::HellCor(c(rnorm(100, mean=1), rnorm(100, mean=50)), c(rnorm(100, mean=1), rnorm(100, mean=50)) )
$Hcor
[1] 0.8612872

$pvalue
[1] NA


Вот это корреляцией не называется, это "ложный к.к. вызванный естественной группировкой в данных"
Эскизы прикрепленных изображений
Прикрепленное изображение
 
  Форум: Медицинская статистика · Просмотр сообщения: #24497 · Ответов: 21 · Просмотров: 14825

p2004r
Отправлено: 3.09.2019 - 21:22


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(ogurtsov @ 2.09.2019 - 19:12) *


А неплохо ("естественные группировки" он за корреляции не признает, что вполне даже логично и хорошо для разборок с ложными к.к.)


Эскизы прикрепленных изображений
Прикрепленное изображение
 
  Форум: Медицинская статистика · Просмотр сообщения: #24421 · Ответов: 21 · Просмотров: 14825

p2004r
Отправлено: 17.05.2019 - 12:07


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(nokh @ 17.05.2019 - 00:17) *
Провели анализ микробных ассоциаций в ожоговых ранах, выборка хорошая - более 400 проб. При оценке значимости ассоциаций с помощью индекса Жаккара в R-пакете jaccard выявилась такая штука: относительно большие индексы могли оказаться незначимыми (J=0.32; Р=0,504), а почти нулевые - значимыми (J=0.06; P=0.049). Если интересно - могу выложить данные, хотя я понял почему так происходит и сделал простой маленький пример. Стал искать другие пути, но не получается справиться самостоятельно. Буду очень признателен за помощь. Описание проблемы и вопросы в прикреплённом файле Help. Второй файл - статья, на которую есть надежда. Может ещё какие варианты подскажите...


Единственно разумный подход это (как и написано в обзоре литературы статьи) рандомизационный тест (или он + бутстреп доверительный интервал на сами частоты, что тоже там есть). Причина -- прямой подсчет частот не дает оценки мощности исследования и размера эффекта, что делает весь этот индекс практически эквивалентным "достигнутому p".

Это все о практически полезных конструктивных результатах которые можно извлечь из этой ситуации. (Ну а статью с "индексом своего имени" конечно не запрещено написать никому smile.gif ).
  Форум: Медицинская статистика · Просмотр сообщения: #23959 · Ответов: 13 · Просмотров: 1987

p2004r
Отправлено: 12.05.2019 - 22:10


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(nokh @ 12.05.2019 - 11:09) *
Большое спасибо, читал и подобное (и даже сам учил студентов:)). Но вот задумал интересную штуку и закрались сомнения, т.к. нужно чтобы было максимально корректно...


1) Если "читали и учили", то странные вопросы задаете. Но впрочем с удовольствием обсужу восстановление матриц описывающих динамическую систему со знающим человеком. smile.gif

"30 дней" это как? Сколько "замеров в день"? Если 1 и 1 пациент, то можно забыть о затее.

2) Что касается pdf с извращениями "здесь мы средние извлекаем и нормируем, а здесь как есть оставляем и все очень быстро в реалтайме делаем", то это увы "не о чём"ТМ. Скользящее среднее получается естественным образом из первых членов разложения матрицы Генкеля построенной по временному ряду (эти я баловался еще в 90е smile.gif, а оказывается "прозой говорил"(С) ). Не удивлюсь если одно через другое выразить можно.

Ну а варианты разложений PCA для тензоров "естественным образом" позволяют обрабатывать многомерные временные ряды.
  Форум: Медицинская статистика · Просмотр сообщения: #23949 · Ответов: 6 · Просмотров: 1264

p2004r
Отправлено: 12.05.2019 - 07:45


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(nokh @ 11.05.2019 - 22:05) *
Насколько корректно применять анализ главных компонент к временным рядам? Полазил по зарубежным форумам и увидел разные мнения. То, что так считают и есть много публикаций - факт, однако PCA основан на корреляциях, для которых требование независимости наблюдений в выборке нарушена. Хочу применить к медицинским данным: динамика изменения 5-7 показателей (температура, ЧСС, АД и др.) у отельного пациента в течение 30 дней после операции.



1) Математики десятилетиями раскладывают на собственные значения ( https://ru.wikipedia.org/wiki/%D0%A1%D0%BE%...%82%D0%BE%D1%80 и https://ru.wikipedia.org/wiki/%D0%A1%D0%B8%...%BD%D0%B8%D0%B5 ) матрицу имени Hankel ( https://ru.wikipedia.org/wiki/%D0%93%D0%B0%...%B8%D1%86%D0%B0 и https://en.wikipedia.org/wiki/Hankel_matrix).

Цитирую: "Hankel matrices are formed when, given a sequence of output data, a realization of an underlying state-space or hidden Markov model is desired. The singular value decomposition of the Hankel matrix provides a means of computing the A, B, and C matrices which define the state-space realization. The Hankel matrix formed from the signal has been found useful for decomposition of non-stationary signals and time-frequency representation."(С)

Ну и пример такой оценки в pdf.

2) PCA не основан на к.к., не читайте мурзилки где написана эта глупость. PCA это один из методов _тождественного_ _линейного_ преобразования системы координат в которых помещена конечная выборка. Почитайте хотя бы википедию:

"Метод главных компонент применим всегда. Распространённое утверждение о том, что он применим только к нормально распределённым данным (или для распределений, близких к нормальным) неверно: в исходной формулировке Пирсона ставится задача об аппроксимации конечного множества данных и отсутствует даже гипотеза о их статистическом порождении, не говоря уж о распределении."(С)




Прикрепленные файлы
Прикрепленный файл  TP3045.pdf ( 391,56 килобайт ) Кол-во скачиваний: 32
 
  Форум: Медицинская статистика · Просмотр сообщения: #23945 · Ответов: 6 · Просмотров: 1264

p2004r
Отправлено: 27.03.2019 - 09:18


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(nokh @ 26.03.2019 - 22:19) *
Это ggtern?


Да, это сырой бутстреп в ggtern.

PS чистая картинка вот так выглядит
Эскизы прикрепленных изображений
Прикрепленное изображение
 
  Форум: Медицинская статистика · Просмотр сообщения: #23850 · Ответов: 9 · Просмотров: 2033

p2004r
Отправлено: 26.03.2019 - 21:02


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Собственно эта конкретная задача решается вот так.

На графике синими линиями изображен the confidence intervals, default to 50, 90 and 95 percent.
Эскизы прикрепленных изображений
Прикрепленное изображение
 
  Форум: Медицинская статистика · Просмотр сообщения: #23847 · Ответов: 9 · Просмотров: 2033

p2004r
Отправлено: 18.02.2019 - 15:47


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(Med_Elena @ 18.02.2019 - 13:22) *
За прошедшие 2 года ВАК не утвердил диссертации 8 нашим аспирантам и 3 докторантам. Одна из причин этих отказов некорректные их результаты статистического анализа. Подскажите к кому мне рекомендовать наших аспирантов и докторантов за помощью в проведении статистического анализа. Хочу также знать и о том, кто из рекомендуемых может производить анализ больших баз данных (по несколько тысяч наблюдений и 2-3 сотни признаков) с помощью сложных многомерных методов. Поскольку ВАК утверждает все диссертации с такими результатами.


А что имеется в виду? Писать главу с анализом данных исследования "под ключ"?

И ещё тонкий момент, а кто планировал то само наблюдение-эксперимент? Бывает что уже поздно что то делать на этапе анализа sad.gif
  Форум: Медицинская статистика · Просмотр сообщения: #23744 · Ответов: 10 · Просмотров: 2370

p2004r
Отправлено: 11.02.2019 - 21:35


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


https://drive.google.com/file/d/1Pu1xFXp6K7...9VeB3YYiUW/view

Странно что они не учли в модели фактор "подопытный".
Прикрепленные файлы
Прикрепленный файл  GoBe_Validation_Report3.pdf ( 1,44 мегабайт ) Кол-во скачиваний: 59
 
  Форум: Медицинская статистика · Просмотр сообщения: #23732 · Ответов: 1 · Просмотров: 1070

p2004r
Отправлено: 7.02.2019 - 15:41


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(comisora @ 7.02.2019 - 13:37) *
Коллеги, доброго времени суток!

Даны ЮЛ "Рога" и "Копыта", которые предлагают наборы "комплексных решений". Сама суть решения содержится в договорах (персональный манагер, круглосуточная тех.поддержка, сопровождение документообороту по различным условиям и т.п.), некоторые пункты различаются при разных уровнях обслуживания (ВИП-клиентам кофе и шоколадку во время ожидания). Сами данные, понятно, разнородные - часть показателей счётные (количество оформленных бумажек и т.п.), часть - это некоторые условия в текстовой форме с "уникальными" предложениям. Спросили - как можно "объективно" сравнить наборы услуг.

Я подумал, что это из области MCA/PCA/MDS, но не уверен (смущает большое количество разношёрстных условий и предложений). Может быть, кто-то знает литературу в которой можно поискать пример решения схожей задачи или имеет опыт анализа таких данных и готов им поделиться? Предполагаю, что в банковской/страховой/финансовой аналитике такие задачи рассматривались и какие-то способы решения данных задач имеются. Бегло просмотрел CRAN Task Views в разделе финансы и эконометрия, подходящего ничего не нашёл.

Заранее спасибо за советы/рекомендации/предложения/примеры.


https://journal.r-project.org/archive/2016/...RJ-2016-054.pdf
  Форум: Медицинская статистика · Просмотр сообщения: #23721 · Ответов: 7 · Просмотров: 2003

p2004r
Отправлено: 30.01.2019 - 08:52


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(PYuliya @ 29.01.2019 - 15:06) *
Это проспективное когортное исследование. На данном этапе решили оценить толщину КИМ и проанализировать факторы риска в группах с КИМ+ и КИМ -


это наблюдение, и без контрольной группы оно несомненно "придет к открытию"
  Форум: Медицинская статистика · Просмотр сообщения: #23711 · Ответов: 6 · Просмотров: 1481

p2004r
Отправлено: 29.01.2019 - 14:49


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(PYuliya @ 29.01.2019 - 14:02) *
Добрый день!
Подскажите, правомочно ли при планировании дизайна исследования для определения факторов риска развития субклинического атеросклероза сравнение 2 групп пациентов с СД2 типа по наличию или отсутствию увеличения толщины комплекса интима-медиа, то есть без включения группы контроля здоровых лиц без СД2?

С Уважением, Юлия.



Это эксперимент или наблюдение?
  Форум: Медицинская статистика · Просмотр сообщения: #23706 · Ответов: 6 · Просмотров: 1481

p2004r
Отправлено: 27.01.2019 - 10:44


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(passant @ 23.01.2019 - 17:03) *
Ну, я так понял, что приведенную мною ссылку вы так и не прочитали. Жаль.


Не надо жалеть, все он прочитал, оттуда и скопировал скорее всего smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #23693 · Ответов: 4 · Просмотров: 1361

p2004r
Отправлено: 14.01.2019 - 14:49


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(зоо @ 12.01.2019 - 15:20) *
Еще такой вопрос. Если в ряде не 12 месяцев, а например 8, с октября по июнь. Корректно ли делать прогноз на неполных данных? Вообще в целом какое минимальное число месяцев в ряде должно быть для прогноза пусть на 1 год.


Это зависит от конкретных данных _прежде_ всего.

А спрашивать когда "едешь в машине" на форуме совета -- "делать ли мне поворот на лево после поворота на право", и потом вопрошать "а там мне по другому посоветовали, как теперь быть" бесполезное занятие.
  Форум: Медицинская статистика · Просмотр сообщения: #23659 · Ответов: 21 · Просмотров: 5025

p2004r
Отправлено: 5.01.2019 - 22:08


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(Ulugbek @ 5.01.2019 - 18:40) *
Добрый вечер! В статистике я новичок и очень сильно надеюсь на вашу помощь. Есть два диагностических метода(определение плотности хрусталика). Один- инструментальный, другой- не инструментальный. В обоих результаты распределяются по степеням: всего 5 степеней. Отличием является то, что инструментальный метод дает результаты в процентах, а второй- по цвету хрусталика. Число исследований 30. Вопрос:Как можно определить точность инструментального по отношению к не инструментальному(как бы странно это не звучало). Направьте , пожалуйста. Заранее благодарю.


Получается есть 30 глаз (или все таки людей???) у которых измерили нечто двумя разными разными линейками с пятью непонятно как нанесенными последовательными отрезками на каждой.

Ну так и смотрим --- можно ли разместить 30 точек таким образом на прямой, что бы они удовлетворили ограничениям линеек, при условии что границы отрезков на каждой "можно двигать".

Если укладывается, то "абсолютно точно" smile.gif.
  Форум: Медицинская статистика · Просмотр сообщения: #23627 · Ответов: 3 · Просмотров: 1433

p2004r
Отправлено: 25.12.2018 - 14:46


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(зоо @ 25.12.2018 - 12:04) *
Вопрос звучит просто.


Много обещающее начало.

Ответ звучит тоже "просто", прочитать https://en.wikipedia.org/wiki/Autocorrelation , понять что спросил скорее всего про стационарные ряды (если нет, читаем дальше Decomposition and Filtering + Seasonality + Stationarity, Unit Roots, and Cointegration в https://cran.r-project.org/web/views/TimeSeries.html) и посмотреть как анализируют автокорреляцию. Если сезонность связана именно с календарем воспользоваться готовыми средствами в которые встроена кроссвалидация (например https://cran.r-project.org/web/packages/prophet/prophet.pdf).


  Форум: Медицинская статистика · Просмотр сообщения: #23604 · Ответов: 21 · Просмотров: 5025

p2004r
Отправлено: 1.12.2018 - 15:26


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(kont @ 1.12.2018 - 14:08) *
Подскажите, вот провел я множественную регрессию. Смотрю остатки. У меня возник, а какие остатки приемлемые, а какие нет.
Например исходное значение 24, предсказано 23, остаток=1. Нормально ли это? Т.е. вопрос какое максимальное расхождение считается допустимо, чтобы сказать, это модель крута?(с учетом того, что остаток в ноль, не такое частое явление, увы)


Крутизна модели определятся минимумом информационного критерия (одного из). Он собственно и помогает принять решение на какой "крутизне" модели разумно остановиться.

https://ru.wikipedia.org/wiki/%D0%98%D0%BD%...%B8%D0%BA%D0%B5
  Форум: Медицинская статистика · Просмотр сообщения: #23557 · Ответов: 3 · Просмотров: 1408

p2004r
Отправлено: 30.11.2018 - 10:59


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(paravoz @ 30.11.2018 - 03:06) *
Хорошо, заведу такую традицию - раз в 5 лет ходить в на форум с вопросом о доверительных интервалах для смертности. smile.gif Лет через 70-80 может быть опубликую статью о динамике мнений относительного данного вопроса!


Кандидат искренне засмеялся. Но засмеялся один и почувствовал неловкость.
  Форум: Медицинская статистика · Просмотр сообщения: #23553 · Ответов: 24 · Просмотров: 5747

p2004r
Отправлено: 29.11.2018 - 18:34


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(paravoz @ 29.11.2018 - 15:18) *
Ок. Коллеги, сдаюсь!!! Раз уж медико-статистическая элита считает, что ДИ можно и нужно считать и только я единственный кто считает иначе, то буду считать. smile.gif smile.gif smile.gif
Спасибо всем за терпение, комментарии и глубокий мыслительный процесс!



не отчаивайтесь, может через пять дет очередной заход даст больше жира
  Форум: Медицинская статистика · Просмотр сообщения: #23546 · Ответов: 24 · Просмотров: 5747

p2004r
Отправлено: 28.11.2018 - 10:12


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(paravoz @ 28.11.2018 - 09:19) *
Да, этот вопрос я уже поднимал 5 лет назад, но к какой-то внятной общей позиции тогда, насколько я помню, мы не пришли.
Посмотрел в Гугле confidence interval for prevalence, но во всех найденных материалах либо напрямую указывается на выборочные исследования, либо о том в каком (сплошном или выборочном) исследовании рассчитывается ДИ для prevalence не указано.
Несколько убеждает приведение ДИ для заболеваемости ВОЗ, но дело в том, что ВОЗ по разным странам использует лишь выборочные данные. В большинстве стран мира не ведется такого стат.учета как в России. Поэтому для оценки смертности, заболеваемости и т.д. ВОЗ использует выборочные исследования, в которых ДИ вполне оправдан. Не разбирался, что за данные (выборочные или по данным сплошного наблюдения) приведены по Вашим ссылкам, но даже готов предположить, что там приведены данные по результатам сплошного наблюдения и вполне правомочно рассчитаны ДИ.

Коллеги, с расчетами ДИ для роста или возраста всего населения (то есть вроде как генеральной совокупности) все понятно. Хотя не понятно, что этот интервал показывает. Упростим задачу. Есть два дома. В одном доме проживает 10 человек и в другом доме проживает 10 человек. Стоит задача определить в каком из этих домов люди в среднем старше. Не знаю зачем это может быть необходимо, но допустим это необходимо управляющей компании зачем-то. Предположим, что распределение возрастов подчиняется закону нормального распределения. Посчитав средний возраст в 1 доме, получили 35,2 года, во 2 доме - 54,8 года. Даже посчитали стандартное отклонение. В первом доме 8,3 года, во втором - пусть тоже 8,3. Как мне кажется, задача решена. Даже без учета стандартного отклонения и дальнейшего расчета критерия Стьюдента, можно сказать, что во втором доме жители в среднем старше, чем в первом.

Предположим, что я задачу решил неправильно. И каким-нибудь методом (бутстрепом или простым расчетным путем через ошибку среднего) посчитаем доверительные интервалы, которые показывают вероятный интервал среднего возраста в какой-то совокупности. Вот непонятно в какой. В районе? Так управляющей компании не надо знать средний возраст в районе. Ей надо знать в этих конкретных двух домах. Может этой совокупностью является другие моменты времени, в которые не проводилось исследование возраста? То есть интервалы среднего возраста, который может оказаться завтра или послезавтра? Но это тоже не интересует управляющую компанию. Грубо говоря выводы и действия, которые управляющая компания совершает на основании среднего возраста, необходимо совершить сегодня, а не завтра или послезавтра. Завтра или послезавтра УК снова проведет по данным прописанного в домах населения это небольшое исследование. Я вот к чему. В данном очень упрощенном примере зачем этот самый ДИ, на какую совокупность экстраполируется средний возраст и зачем он вообще в данном случае для принятия решения управляющей компанией?

Вернусь к смертности. Если бы мы имели какое-то распределение смертности, например за 10 лет или за 1 год, но по разным регионам, то можно было бы посчитать ДИ опять же бутстрепом или расчетным путем. Но мы имеем данные только за 1 год по одному региону. Например, умерло 1000 человек, среднегодовая численность за этот год составила 100000 человек. Посчитали смертность получилось 1000 на 100000 населения. Считаем ДИ. Например, получили ДИ равное 100. Бутстрепом же мы его посчитать не можем? Из чего извлекать подвыборки, если мы имеем только два числа 1000 умерших и 100000 населения? Не можем мы генерировать случайные числа от 0 до 1000? Если можем, то почему до 1000, а не до 2000 или 10000? Хорошо. Посчитали ДИ расчетным путем по формулам, которые приводятся в различных руководствах. Получается интервал от 900 до 1100 на 100000 населения.

Самый главный вопрос ради которого я так много написал вот в чем. Что показывает данный интервал?
Он показывает вероятные значения смертности в предыдущие или в последующие периоды в этом же регионе? Предыдущие мы знаем и так, а последующие нам пока не нужны.
Или вероятные значения смертности в изучаемый период в других регионах? Это думаю в принципе невозможно.
Или вероятные значения смертности в изучаемый период в более крупном территориальном образовании - в федеральном округе? Это тоже думаю не возможно, так как один регион не является репрезентативной выборкой для федерального округа.
Или вероятные значения смертности в течение года в изучаемом регионе? Но это тоже невозможно, так как методика расчета ДИ, учитывающая только значения числа умерших (1000) и среднегодовой численности населения (100000) не может учитывать внутригодовые колебания. То есть какие бы небыли внутригодовые колебания умирающих в каждый отдельный день ДИ всегда будет одним и тем же, так как при расчете учитываются только число умерших и численность населения. Соответственно такой ДИ не может отражать внутригодовые колебания.
У меня закончились варианты того, что может отражать ДИ для смертности. Давайте этот список продолжим, может в нем появится истина. smile.gif smile.gif smile.gif



Доверительный интервал (или восстановленное полное распределение, а не 3 точки взятые из него) показывает оценку показателя в генсовокупности из которой эта выборка взята. Если некая другая выборка в него не впишется, то она взята из другой генсовокупности. Существует ли "генсовокупность" как таковая (ну и всякие "актуальные бесконечности" из которых она состоит более чем полностью)? Ну вот процентов 30 физиков считает что это объективная реальность лежащая в основе устройства окружающего нас мира.

---8<--

В свою родную деревню приезжает на отдых кандидат наук Константин Иванович Журавлёв с женой и дочерью. Вечером местные жители собираются возле дома Глеба Капустина, славящегося умением сре́зать любого интеллектуала-горожанина. Узнав о прибытии Журавлёва, Глеб обещает землякам, что будет держать марку. Вскоре большая группа селян во главе с Капустиным отправляется к Константину Ивановичу в гости. Тот встречает визитёров приветливо, усаживает за стол, но быстро начинает понимать, что душевной беседы не получится. Разговор берёт на себя Глеб. Он постоянно озадачивает хозяина внезапными вопросами о первичности духа и материи, о понятии ?невесомость? применительно к философии, о проблеме шаманизма на северных территориях. Журавлёв теряется под напором бросаемых в его адрес реплик ? диалог с Глебом кажется ему абсурдным, но мужики, наблюдающие за ?спектаклем?, явно одобряют поведение Капустина. Тот, психологически подавив оппонента, объясняет суть устроенного им представления фразой: ?Люблю по носу щёлкнуть ? не задирайся выше ватерлинии! Скромней, дорогие товарищи??

---8<--

PS простите, но всяких "остроумцев" с некой метафизической "фигой в кармане" в интернете столько что они просто не отличимы друг от друга и это откровенно раздражает (правда большинство свою "фигу из кармана" почему то интуитивно стремаются доставать на публике smile.gif )
  Форум: Медицинская статистика · Просмотр сообщения: #23541 · Ответов: 24 · Просмотров: 5747

p2004r
Отправлено: 27.11.2018 - 17:29


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(paravoz @ 27.11.2018 - 14:58) *
Интересная позиция, даже вполне понятная. Я пока пытаюсь дальше поразмышлять на предмет того, может ли среднегодовая численность населения рассматриваться с той позиции, которую Вы описываете.

Даже если предположить, что такие умозаключения верны, то как быть например с таким коэффициентом. Уж простите, но это первое что пришло в голову. Коэффициент младенческой смертности = число детей, умерших в течение года на 1 году жизни / число родившихся живыми в данном году * 1000. В данном случае и числитель и знаменатель точные абсолютные величины, которые определяются на конец года. Получается ли, что для данного показателя нельзя считать ДИ.

И второе. Если действительно можно для заболеваемости рассчитать ДИ, то что это за интервал? Ну то есть вероятное значение заболеваемости в какой совокупности он показывает? По логике вещей в генеральной. Но что, в данном случае, будет являться генеральной совокупностью?
Я к чему. Пусть с математической точки зрения ДИ для заболеваемости использовать можно. Допустим (хоть я пока не совсем с этим согласен smile.gif ). Но какой в этом ДИ "физический смысл". Если у выборки из населения города посчитать средний рост и для него построить ДИ, то можно сказать, что ДИ это вероятный интервал среднего роста всего населения города. А в данном случае что будет являться этой самой генеральной совокупностью?

PS. Вами действительно высказана интересная позиция, но, правда, пока не могу понять как ее принять. smile.gif smile.gif



Да и сам процесс "заболеет-не заболеет", "поставят-не поставят диагноз" это реализация случайного процесса. То что мы его застали именно в таком состоянии очень даже подлежит оценке. Оценить мы можем только из соображений что процесс мог быть реализован бесконечным числом способов, но каждый раз риску подвергалась выборка известного нам размера с неизвестным нам уровнем заболевания (то что "ситуация принципиально не повторяется" вообще довольно спорно, повторюсь что интерпретация в виде мультиверса вполне себе имеет место).

Просто и быстро получаем бутстрепом оценку этого параметра. Если вообще 0 случаев чего то, то получаем "оценки сверху" на получение таких случаев в будущем исходя из разумной ошибки выбранной (в том числе например вообще считаем сложную гипотезу с учетом _всей_ истории наблюдения за популяцией (с учетом "черных лебедей" -- (эпи|пан)демий,)).
  Форум: Медицинская статистика · Просмотр сообщения: #23537 · Ответов: 24 · Просмотров: 5747

p2004r
Отправлено: 27.11.2018 - 17:13


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(paravoz @ 27.11.2018 - 03:17) *
В том то и дело, что несколько раз извлечь выборку (даже не знаю можно ли ее назвать выборкой) нельзя. Если число умерших в 2017 году составило 18 000 человек, то их умерло 18 000. Хоть как извлекай и хоть сколько раз, все равно число умерших составит 18 000 человек и всегда это будут одни и те же лица.


Так уже со следующим "родившимся-умершим" (и уж наверняка на следующий отчетный период) мы получаем новую выборку и встает вопрос -- "она получена из другой генсовокупности или нет?"
  Форум: Медицинская статистика · Просмотр сообщения: #23536 · Ответов: 24 · Просмотров: 5747

p2004r
Отправлено: 26.11.2018 - 10:01


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(paravoz @ 26.11.2018 - 04:37) *
Уважаемые коллеги!

Уже неоднократно сталкиваюсь с тем, что в статьях, посвященных изучению каких-либо эпидемиологических показателей (заболеваемость, смертность и т.д.), помимо самих показателей приведены какие-то значения после знаков плюс/минус. Например, смертность населения составила 20,2?0,8 на 1000 населения.
Зачастую из статьи не понятно, что это за значение, но в некоторых указывается, что это либо стандартная ошибка, либо доверительный интервал.
Честно говоря всегда считал, что:
1. Доверительный интервал - интервал, который показывает диапазон наиболее вероятных значений показателя в генеральной совокупности.
2. Если рассчитывается показатель смертности, например по региону, то этот показатель учитывает всю генеральную совокупность.

Смертность - число умерших/среднегодовая численность населения. Если считать всех умерших выборкой, то тогда что же будет генеральной совокупностью?!
В общем мне всегда казалось, что при расчете популяционных эпидемиологических показателей доверительный интервал рассчитывать не нужно. Не то чтобы не нужно, а даже некорректно. Обычно я на такие интервалы особого внимания не обращал, но сегодня рецензент на мою статью сделал замечание и предложил мне представить к показателям еще и доверительный интервал.

Подскажите, действительно ли необходимо/корректно рассчитывать доверительные интервалы в таких ситуациях? Если нет, то подскажите как грамотно обосновать рецензенту это или на какую литературу сослаться? Сам я нигде прямого запрета на это не нашел. Заранее всем спасибо!



Если можно извлечь выборку несколько раз, то генеральная совокупность таки есть. А число интервалов отчетных в прошлое и будущее как бы простирается бесконечно (или если ближе теория мультиверса, то генсовокупность исходов всегда бесконечная получается). smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #23525 · Ответов: 24 · Просмотров: 5747

p2004r
Отправлено: 22.10.2018 - 18:47


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(nikita_zab @ 16.10.2018 - 17:38) *
Добрый день!

Прошу напомнить термин, которым называют применение всевозможных статистических методов к одним и тем же данным в попытке найти значимую разницу или закономерности.

И второй вопрос из области философии. Имеет ли смысл применять несколько методов для оценки "здесь что-то есть". И если применяется сразу несколько методов как быть, если некоторые из них показывают "р меньше 5 сотых", а другие нет?


Вообще использовать для анализа "просто собранных" данных в ходе того что называется "наблюдение" вот эти все "проверки гипотез" "первым делом" (и иные методы матстатистики) крайне плохая идея. Если эксперимента по сути не было (с соответствующим планированием цели), то следует вначале обращаться к эксплораторному (разведочному) анализу. Он происходит в виде простого преобразования данных (обычно проекции в пространство меньшей размерности) без каких либо ограничений со стороны матстатистики.

Если "разглядывание данных" с помощью методов разведочного анализа дало какие то гипотезы о "картине мира" в области изучаемого явления, то пишете модель описывающую ваши идеи в явном виде и проводите конфирматорный анализ (естественно делая эту операцию однократно).
  Форум: Медицинская статистика · Просмотр сообщения: #23468 · Ответов: 6 · Просмотров: 2541

p2004r
Отправлено: 1.09.2018 - 16:06


Дух форума
*

Группа: Пользователи
Сообщений: 1060
Регистрация: 26.08.2010
Пользователь №: 22699


http://libgen.io/search.php?req=%D0%A1%D1%...&column=def

  Форум: Медицинская статистика · Просмотр сообщения: #23315 · Ответов: 12 · Просмотров: 3822

42 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена