Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

6 страниц V   1 2 3 > » 

passant
Отправлено: 1.10.2019 - 15:06


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Не знаю, насколько это будет актуально, но вот наткнулся на приятную вводную статью по использованию Data Science в клинических исследованиях:
https://towardsdatascience.com/clinical-dat...on-9c778bd83ea2
Специалисты вряд ли найдут для себя что-то новое, разве что всегда полезно "перепроверить" свое понимание структуризации анализа. А вот для новичков, думаю, будет одновременно и любопытно, и полезно, и просто для понимания.
  Форум: Медицинская статистика · Просмотр сообщения: #24607 · Ответов: 12 · Просмотров: 4776

passant
Отправлено: 28.09.2019 - 22:22


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(тот кото ый @ 27.09.2019 - 17:41) *
К сожалению по ссылкам ничего не открывается ((

Почему ник мужского рода?))

Проверил. По каждой ссылке открывается страничка, которая предлагает вам на выбор несколько вариантов (зеркал) для скачивания искомых книг, или торрентов, через которые эти книги можно скачать. Ну, или у вас стоит специальная блокировка, что вряд-ли.
  Форум: Медицинская статистика · Просмотр сообщения: #24599 · Ответов: 12 · Просмотров: 4776

passant
Отправлено: 23.09.2019 - 18:05


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


аналоги теста Стьдента для дискретных данных (сравнение двух выборок) и дисперсионного анализа (сравнение трёх и более выборок)
Не уверен, что вы правильно понимаете (интерпретируете) термин "дискретный показатель", но скорее всего для вашей задачи подойдет (почти) любой непараметрический тест, начиная с Вилкоксона-Манна-Уитни.
Анализ проверки равенства медиан нескольких выборок - критерий Краскела-Уоллиса.
  Форум: Медицинская статистика · Просмотр сообщения: #24579 · Ответов: 6 · Просмотров: 710

passant
Отправлено: 22.09.2019 - 23:04


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Ну, на форуме самостоятельно искать ответ на свой вопрос вам было лень. Но мне казалось, что в интернет искать сегодня умеют все - от младенцев до бабушек. Оказалось - нет.
Ладно, помогу вам еще раз
http://gen.lib.rus.ec/book/index.php?md5=5...D36113B31D7C3AF
http://gen.lib.rus.ec/book/index.php?md5=9...B2D6D3684CFB5A9
"Медицинскую статистику" искать для вас не буду - ибо не считаю эту книгу такой, по которой следует осваивать эту науку.
За подсказку - прошу ответить и на мой вопрос: Почему ваш ник - явно мужского рода, а аватар - ну как бы не совмем мужского :-)?
  Форум: Медицинская статистика · Просмотр сообщения: #24576 · Ответов: 12 · Просмотров: 4776

passant
Отправлено: 21.09.2019 - 22:25


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Скажите, а самостоятельно просмотреть этот форум перед тем, как задавать вопрос - что мешает?
Ну, если вы сверхзаняты, и не имеете на это ни секунды свободного времени, то сделаю это за вас:
http://forum.disser.ru/index.php?showtopic=4288
Пользуйтесь!
  Форум: Медицинская статистика · Просмотр сообщения: #24572 · Ответов: 2 · Просмотров: 472

passant
Отправлено: 4.03.2019 - 19:07


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Б_Т_Г @ 1.03.2019 - 09:35) *
За последние 5 лет утвердили примерно 100 диссертаций, в которых как раз и есть результаты сложных многомерных методов, полученных в коллективе, руководимом Леоновым.

Простите меня, человека далекого от медицины. Но по этому посту возник вопрос.
Во-первых, разве "в коллективе, руководимом Леоновым" разрабатывают методы? Если "да", то было бы интересно узнать, что это за методы, почитать, ознакомиться, проанализировать, возможно - применять в будущем. Ведь если из вот так "На ура" легко и непринужденно принимает ВАК, то наверное, это что-то интересное и важное? И непонятно, почему "результаты сложных многомерных методов" появились в 100 каких-то (сторонних) диссертациях, а не в диссертациях членов "коллектива, руководимого Леоновым"?
Или фразу все таки надо читать, как "есть результаты ПРИМЕНЕНИЯ сложных многомерных методов, полученных в коллективе, руководимом Леоновым"?
  Форум: Медицинская статистика · Просмотр сообщения: #23772 · Ответов: 10 · Просмотров: 2666

passant
Отправлено: 20.02.2019 - 23:54


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(зоо @ 20.02.2019 - 17:56) *
Подскажите, пожалуйста, пошагово, как работают Алгоритмы k-mean и случайного леса, без формул, ссылки на вики не нужны) сам умею вики смотреть, а там одни формулы
Интересует словесное описание работы этих методов

k-mean
шаг первый
вторый

случайный лес
шаг первый
второй


Ну, это примерно как просьба рассказать, как выполняют операцию по удалению аппендицита на словах и не употребляя медицинские термины.

Но если кратко - то и k-mean относится к алгоритмам кластеризации (обучение без учителя).
Первый шаг - в пространстве описания объектов вводится мера подобия (расстояния).
Второй шаг - берется множество объектов, задается желаемое количество кластеров. Назначаются произвольные точки в качестве центроидов кластеров.
Шаг третий. Как только набор центроидов становится доступен, каждый кластер обновляется таким образом, чтобы содержать точки ближайшие к данному центроиду.
Шаг четвертый. Как только набор кластеров становится доступен, каждый центроид пересчитывается, как среднее значение всех точек, принадлежащих данному кластеру.
Шаги 3 и 4 повторяются, пока кластеры и центроиды не перестанут изменяться.
Все проще простого, и без всякой математики.

Случайный лес. Относится к алгоритмам классификации (обучение с учителем).
По сути это совместное применение множества решающих деревьев.
Шаг первый. Выбирается подвыборка обучающей выборки и по ней строится дерево. При построении дерево для каждого узла случайно выбираются наборы признаков из которых по определенному критерию ищется лучший. Этот шаг повторяется многократно для различных подвыборок обучающей выборки. В итоге получаем множество деревьев.
Шаг второй. Берем полученное множество деревьев, берем объект классификации и пытаемся решить задачу каждым из деревьев. Ответы усредняем (обычно - в случае регрессии), или принимаем решение по принципу голосования (обычно - в задачах классификации).
Как вы просили - просто, словесно и без математики.

Но если честно, я не понимаю, если вы "сами умеете читать вики", то зачем вам еще словесное описание? Только не говорите, что хотите научиться этим "премудростям" без изучения математики и формул. Я же не хочу научиться удалять аппендицит по вашему описанию операции, без предварительно серьезного изучения анатомии, физиологии, диагностики и еще чего-то там, что составляет "таблицу умножения" медицины.
  Форум: Медицинская статистика · Просмотр сообщения: #23750 · Ответов: 1 · Просмотров: 834

passant
Отправлено: 7.02.2019 - 16:58


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(comisora @ 7.02.2019 - 12:37) *
Я подумал, что это из области MCA/PCA/MDS

Вообще-то это из области Теории принятия решений. Только там формальные методы формальны настолько,что если просто "сравнить два конкретных предложения" - то огород городить замаетесь (Формирование множества возможных решений, Формирование критериев оценки, Построение индикаторов, Оценка решения по заданным критерием, Функция полезности, Выбор наилучшего решения, Обобщение мнения экспертов, Способы учета неопределенности .... бррррр). Есть даже специальный класс программ - СППР (Системы Поддержки Принятия Решений). Если вдруг собрались глубоко вникать - ну так на математических специальностях (в упрощенном виде - на менеджменте тоже) в университетах на эту тему целые курсы есть, или даже несколько. И учебников - достаточно. Копайте, если надо. Главное - не закопаться wink.gif
  Форум: Медицинская статистика · Просмотр сообщения: #23722 · Ответов: 7 · Просмотров: 2123

passant
Отправлено: 28.01.2019 - 20:47


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Я не врач, поэтому не могу обсуждать, продуктивен или нет подход, который хочет применить ТС. Более того, я уверен, что если-бы у него было больше признаков, то можно было бы и более мощные критерии применять, и более точные результаты получать. Хоть самостоятельно, хоть обратившись к профессионалам.
Однако, просто прочитав вопрос (возможно - учебный), хочу сразу же просто указать ТС, что он ошибается в той части, где пишет что можно использовать только четехпольную таблицу. На самом деле таблица может быть "сколько-угодно-польная". Я специально попытался найти обсуждение этого вопроса именно для врачей.
https://lit-review.ru/biostatistika/kriteri...kvadrat-pirsona
https://cyberleninka.ru/article/n/analiz-poryadkovyh-dannyh
Посмотрите также известную книгу В.М. Зайцев и др. "Прикладная медицинская статистика". На стр.303 есть пример весьма подобный вашему.
Можно - при необходимости- и другие источники поискать.
Так что в поставленной формулировке решение задачи "по зубам" даже студенту-медику. На сколько его можно применять в реальных врачебных ситуациях - оставляю для обсуждения профессиональным медикам.
  Форум: Медицинская статистика · Просмотр сообщения: #23697 · Ответов: 6 · Просмотров: 1534

passant
Отправлено: 23.01.2019 - 17:03


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(зоо @ 23.01.2019 - 12:50) *
passant, что означает значение 20.19952, и что нам дает sigma.t? как эти значения интерпретировать.

Ну, я так понял, что приведенную мною ссылку вы так и не прочитали. Жаль.
Иначе вопрос был-бы, не "что означает занчение 20.19952", а "почему оно именно 20.19952", что явно не совпадает с приведенными в файле исходными данными.
  Форум: Медицинская статистика · Просмотр сообщения: #23678 · Ответов: 4 · Просмотров: 1424

passant
Отправлено: 22.01.2019 - 20:01


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(зоо @ 21.01.2019 - 14:56) *
Я решил создать новую тему,чтобы не захломлять предыдущую.
Я в R провел этот анализ и получил такие результаты/ Что значит эта условная дисперсия и как проинтерпретировать
predict(b, n.ahead = 10)
# meanForecast meanError standardDeviation
# 1 20.19952 20.82351 20.82351
# 2 20.19952 20.84651 20.84651
# 3 20.19952 20.86948 20.86948
# 4 20.19952 20.89243 20.89243
# 5 20.19952 20.91535 20.91535
# 6 20.19952 20.93825 20.93825
# 7 20.19952 20.96112 20.96112
# 8 20.19952 20.98396 20.98396
# 9 20.19952 21.00679 21.00679
# 10 20.19952 21.02959 21.02959

Почему meanForecast имеет одни и теже значения?
Если необходимо, могу код в R дать.

Мы можем только догадываться, что там вы реально написали в своем скрипте, но вопрос ваш периодически задают те, кто начинает заниматься анализом рядов. Ну, например:
https://stats.stackexchange.com/questions/1...ng-arima-models
Так что "все нормально".
Единственное, что меня круто напрягает, это то, что данные в вашем файле находятся в диапазоне примерно 3734.0-3740.0 а вот meanForecast каким-то чудом оказывается равным 20.19952. Я бы при таких ответах первым делом бы полез в (свой) код искать, в чем дело?
  Форум: Медицинская статистика · Просмотр сообщения: #23675 · Ответов: 4 · Просмотров: 1424

passant
Отправлено: 22.01.2019 - 17:27


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Вот, совершенно случайно наткнулся на статью о выявлении сезонности в коротких рядах. С примерами. Обратите внимание, что такое "короткий" и на сколько "долгосрочный" прогноз при этом можно сделать.
https://robjhyndman.com/hyndsight/tslm-decomposition/
  Форум: Медицинская статистика · Просмотр сообщения: #23674 · Ответов: 21 · Просмотров: 5282

passant
Отправлено: 19.01.2019 - 22:18


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(зоо @ 19.01.2019 - 17:03) *
passant, почему нет? Можете обосновать? и на каких- Да?

Вы не рекордсмен - вот тут https://toster.ru/q/596402 некто даже по данным двух(!!!) месяцев пытается предсказать покупки сезонного товара на пол года вперед. А у вас аж по 8 месяцам и всего на два года. Да лЁгко! :-)
Если серьезно - то ваш вопрос перевернут с ног на голову.
Вы прямо спросили- "можно?". Я столь-же прямо ответил - "нет". Если более расширенно, то "нет, при имеющихся исходных данных сделать прогноз на заданный период упреждения с разумной и практически осмысленной точностью невозможно". Вы ставите такой ответ под сомнение? Тогда будьте любезны обоснуйте, на основании информации из каких источников вы считаете его некорректным и с помощью каких инструментов вы планируете делать то, что я считаю невозможным. Невозможным, ибо это противоречит как методическим основам предикативного анализа, так и обычной человеческой логике.
  Форум: Медицинская статистика · Просмотр сообщения: #23671 · Ответов: 21 · Просмотров: 5282

passant
Отправлено: 17.01.2019 - 14:02


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(зоо @ 17.01.2019 - 12:20) *
Ну например на таких данных,месячные продажи.

прогноз на два года корректно делать?

Нет.
  Форум: Медицинская статистика · Просмотр сообщения: #23669 · Ответов: 21 · Просмотров: 5282

passant
Отправлено: 29.12.2018 - 12:51


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Вообще-то на первых страницах любого учебника по прогнозированию на основе временных рядах объясняется, что вопрос
Цитата(зоо @ 29.12.2018 - 00:37) *
какие модели лучше для долгосрочного прогнозирования, а какие для краткосрочного или разницы нет

безотносительно к предметной области лишен всякого смысла.
Скажите, для предсказания экономического развития страны один месяц это краткосрочный прогноз или долгосрочный? А для предсказания курса тугрика к доллару? А для предсказания состояния больного? А больного сахарным диабетом или больного, привезенного с сердечным приступом по скорой?
А вы даже не сказали нам в какой области медицины (?) вы работаете.
Наиболее интуитивно-понятную (но не временнО-упрощенческую) дефиницию периодов статистического прогнозирования я встречал вот примерно такую:
" Термины "кратко-", "средне-" и "долго-" не имеют чёткого определения, но должны зависеть от инерционности (способности объекта сохранять свои характеристики в некоторых пределах в течение заданного промежутка времени при незначительных внешних воздействиях на объект) объекта исследования.
Так краткосрочным можно назвать прогноз, осуществляемый на срок, не превышающий период инерционности объекта исследования. Главное, что характеризует этот тип прогноза - это то, что исследуемый объект (процесс)сохраняет свою устойчивость. Он не подвержен существенным изменениям и может быть достаточно точно спрогнозирован. Прогнозные методы в случае с краткосрочным прогнозированием должны в большей степени учитывать последние полученные данные.
Среднесрочный прогноз - это прогноз на срок, незначительно превышающий период инерционности объекта исследования. В этом случае в динамике показателя может наметиться какая-нибудь тенденция, в частности - изменения параметров модели процесса, которую можно выловить и спрогнозировать с помощью соответствующих математических методов.
Долгосрочный прогноз - это прогноз на срок, значительно превышающий период инерционности. Здесь уже динамику показателя спрогнозировать становится практически невозможно: за этот срок может произойти существенное, случайное и абсолютно непредвиденное заранее изменение в поведении объекта исследования. Именно поэтому для прогнозирования на долгий срок нужно обращаться к различным сценариям и использовать в том числе экспертные методы для выбора оптимистичного, пессимистичного и наиболее вероятного из них.
Методы расчёта периода инерционности объекта исследования пока практически не разработаны, так что его приходится оценивать "на глаз". Более того, период инерционности очевидным образом меняется от одного объекта исследования к другому.
" (--->отсюда, кстати, понятно, почему в приведенных выше примерах при одинаковых периодах упреждения сами прогнозы будет относиться к принципиально разным типам и должны выполняться разными математическими или эвристическими инструментами.)
Это определение возможно не совсем четкое в математическом смысле, зато дает исследователю хоть какие-то ориентиры.
Поэтому если вы хотите осмысленных ответов - приведите семантику вашей задачи. Думаю тогда можно будет предметно говорить и о типе вашего прогноза и о методах, которые имеет смысл применять.
  Форум: Медицинская статистика · Просмотр сообщения: #23619 · Ответов: 21 · Просмотров: 5282

passant
Отправлено: 25.12.2018 - 17:23


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Действительно, наиболее "прямой" путь выявления наличия трендовой и сезонной составляющих - анализ автокоррелограмм. Высокие значения на первом (первых) лагах и низкие на младших - прямой признак наличия тренда. Наличие высоких значений на одном из "не первых" лагах при низких на соседних - признак наличия сезонности, еще и с подсказкой о ее периоде.
Есть и специальные методы анализа. Для выявления наличия тренда - критерий Аббе-Линника, критерий Фостера-Стюарта, критерий серий и еще с полтора десятка других. Для сезонности используется еще и примитивный метод расчета индекса сезонности. Ну и анализ Фурье - классика анализа периодических процессов - никто не отменял.
  Форум: Медицинская статистика · Просмотр сообщения: #23605 · Ответов: 21 · Просмотров: 5282

passant
Отправлено: 29.11.2018 - 20:42


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 29.11.2018 - 18:37) *
Выйдите, passant, ненадолго из меланхоличного состояния и послушайте, чего скажу. Устами проф. Орлова:

с.88:
"Критерий Смирнова основан на использовании эмпирических функций распределения Fm(x) и Gn(x), построенных по первой и второй выборкам соответственно.
Значение статистики Смирнова Dm,n=sup|Fm(x)-Gn(x)| сравнивают с соответствующим критическим значением ... и по результатам сравнения принимают или отклоняют гипотезу Ho о совпадении (однородности) функций распределения." /Эконометрика: учебник для вузов.- изд. 4, дополн. и перераб. - Ростов н/Д: Феникс,2009. - 572 с./

Если вам критически важно построение эмпирических функций распределения (ЭФР, как я и написал) считать самостоятельным этапом, а не частью работы по вычислению критерия, то тогда надо писать, что на "...вход критерия Смирнова подаются две ЭФР".

Но мой пост был ровно о том, что математики ни от кого не скрывали, где надо "брать" ЭФР для критерия, это просто вы не в курсе.

P.S. И не надо благодарить, коллега. Расширять ваш кругозор для меня - удовольствие.

Если бы я был первый день на формуле, ваша манера вести дискуссию, наверно, произвела бы на меня впечатление. Но увы, тем кто тут давненько - она хорошо известна. Поэтому ваши личностные выпады, от которых вы ну никак не можете воздержаться, уже ни у кого не вызывают ни удивления, ни уважения ни нервного трепета. А уж благоговения перед великим и всезнающим - тем более. Но это так, к слову.

Теперь по сути.
Во-первых, я нигде не ставил под сомнение, что критерий основан на использовании и анализе функций распределений. Я это написал в первом же сообщении. А вы меня пытаетесь убедить, что "да он основан на анализе функций распределения" еще и Орлова сюда "призвали". Зачем?

Во-вторых, то что он основан на анализе эмпирических функций распределений никак не отменяет того факта, что предназначен-то он для сравнения двух выборок. И на вход критерия именно выборки подаются. Подтверждение тому - реализация указанного критерия и в Python (модуль scipy.stats функция ks_2samp), и в R(базовая библиотека stats, функция ks.test). Думаю, если покопать - то и в других пакетах/системах будет то-же.

В-третьих, вопрос, который я действительно упоминал, заключался в том, на сколько эмпирическая функция распределения (которая используется в критерии) соответствует функции распределения данной генеральной совокупности (объективно существующей) - в данном тесте никак не изучается и не учитывается (ну, кроме зависимости от N, естественно). Я понимаю, что "математики не от кого не скрывали", а я - в отличии вас, разумеется - просто не в курсе. Может, расширите мой кругозор.

В целом, так и не понял, какой же из высказанных мной тезисов вызвал у вас такую бурную реакцию. Впрочем, бывает. Думаю, дальнейшая дискуссия в таком стиле является бессмысленной и увы, неинтересной. Посему участие в ней заканчиваю.
  Форум: Медицинская статистика · Просмотр сообщения: #23548 · Ответов: 24 · Просмотров: 6025

passant
Отправлено: 29.11.2018 - 15:27


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 29.11.2018 - 13:22) *
/справочно/
Для критерия Смирнова функции распределения не надо "брать" - критерий вычисляет их (ЭФР) "сам".

/Еще более меланхолично/
На вход критерия Смирнова подаются две выборки, по которым вычисляется статистика Колмогорова-Смирнова, которая сравнивается с критическим значением, которое (в свою очередь) определяется из теоретических соображений. И - в конечном итоге - делается вывод, взяты-ли две исходные выборки из одной ген.совокупности или из разных. По факту он сравнивает эмпирические распределения двух выборок (не путать с критерием Колмогорова!!!)
Какую функцию распределения может вычислить критерий, призванный лишь проверить Гипотезу об однородности выборок unknw.gif
  Форум: Медицинская статистика · Просмотр сообщения: #23545 · Ответов: 24 · Просмотров: 6025

passant
Отправлено: 29.11.2018 - 11:25


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(paravoz @ 27.11.2018 - 14:58) *
Интересная позиция, даже вполне понятная. Я пока пытаюсь дальше поразмышлять на предмет того, может ли среднегодовая численность населения рассматриваться с той позиции, которую Вы описываете.

Даже если предположить, что такие умозаключения верны, то как быть например с таким коэффициентом. Уж простите, но это первое что пришло в голову. Коэффициент младенческой смертности = число детей, умерших в течение года на 1 году жизни / число родившихся живыми в данном году * 1000. В данном случае и числитель и знаменатель точные абсолютные величины, которые определяются на конец года. Получается ли, что для данного показателя нельзя считать ДИ.

Никак нет.
В основе развития человеческой цивилизации лежит простая человеческая лень smile.gif . Вот, когда придумывали указанный вами коэффициент именно лень его таким и сделала. Правда врачам это простительно, они людей должны лечить, а не цифры считать, но тем не менее. wink.gif
А теперь без шуток. Именно желание сократить объем работы приводит к тому, что у вас в вашем коэффициенте фигурируют "как-бы" абсолютные величины. На самом деле люди рождаются (и умирают) ежедневно. Значит на самом деле обе ваши "абсолютные величины" есть некий интегральный параметр от значений двух независимых временных рядов, полученных при отображении ежедневного количества соответственно родившихся и умерших. И единственная абсолютная, не требующая никаких доверительных интервалах цифра - это вот "сегодня, 29 ноября, в городе N родилось X младенцев и умерло Y детей до года". А как только вы переходите к рассмотрению годовых показателей - с точки зрения строгой математический статистики - будьте любезны оперировать описанием временных рядов. И в итоге снова имеем отношение случайных величин, для описания которого надо использовать его распределение (или, опять-же по ленности smile.gif - какие-то его параметры ).
На самом деле, если подумать, использование критериев типа Cтьюдента, Фишера и пр. и уж тем более - сравнение по перекрытию доверительных интервалов - идет от желания сократить расходы на вычисления. Потому что единственный "полный" метод сравнения двух случайных выборок - это критерий Смирнова (или - обычно пишут "Колмогорова-Смирнова"). Вот он корректно сравнивает две случайные величины используя их функции распределения (правда вопрос - а где их взять - математики оставляют за скобками). А все остальные критерии по сути были придуманы в виду "ленности", а в реалии - запредельной сложности расчетов в докомпьютерную эру вычислений. Ну а в медицинской статистике в момент ее зарождения - тем более такие расчеты были вне поля зрения. Вот и получаются, что - в том числе - указанные вами коэффициенты - это всего лишь приближенная оценка истинного значения (и вообще-то неизвестного нам) этого коэффициента.
Цитата(paravoz @ 27.11.2018 - 14:58) *
И второе. Если действительно можно для заболеваемости рассчитать ДИ, то что это за интервал? Ну то есть вероятное значение заболеваемости в какой совокупности он показывает? По логике вещей в генеральной. Но что, в данном случае, будет являться генеральной совокупностью?

Так в том-то и дело, что ввиду постоянной изменчивости, вы никак не можете "перебрать" все элементы этой генеральной совокупности.

Цитата(paravoz @ 27.11.2018 - 14:58) *
Пусть с математической точки зрения ДИ для заболеваемости использовать можно. Допустим (хоть я пока не совсем с этим согласен smile.gif ). Но какой в этом ДИ "физический смысл". Если у выборки из населения города посчитать средний рост и для него построить ДИ, то можно сказать, что ДИ это вероятный интервал среднего роста всего населения города. А в данном случае что будет являться этой самой генеральной совокупностью?

А я вот, как не врач, задумался, а о чем приведенный вами коэффициент детской смертности говорит, даже семантически. Ведь за год какие-то из родившихся в данном городе младенцев были перевезены в другие города, и теоретически возможно, что там и умерли. А какие-то из умерших в данном городе - родились и были привезены сюда.И какой тогда смысл этого коэффициента, о чем он говорит? А вот если его трактовать так, как я описал выше - хоть "физический смысл" становиться более-менее понятным. Но оставим эти размышления для медицинских статистиков.
  Форум: Медицинская статистика · Просмотр сообщения: #23542 · Ответов: 24 · Просмотров: 6025

passant
Отправлено: 27.11.2018 - 12:57


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Ну, если хотите рассуждений smile.gif - то позвольте мне вклинится в ваш медицинский спор. На самом деле есть много причин, по которым интервальная оценка показателя типа "заболеваемость" является необходимой - в том числе и те, которые тут уже упоминали. Но я попробую привести еще одно обоснование, причем попробую объяснить "математически, но просто" rolleyes.gif .

1. "Неужели без дополнительных математических расчетов (ДИ или стат. критерии) я не могу сделать вывод о том, что в каком-то конкретном году заболеваемость в конкретном населенном пункте 2 больше, чем заболеваемость в населенном пункте 1". - по моему мнению, не можете. Все что вы корректно математически можете сказать - это "За год в населенном пункте Х заболело на 2 человека больше, чем в населенном пункте Y". Вы даже можете сказать, что "количество заболевших в городе Х было в два раза больше, чем в городе Y". Но именно так "(абсолютное) Количество заболевших" - и не более того. Потому что, говоря математическим языком, ваши данные измерены в абсолютной шкале. И все остальные операции (а ваши заключения и есть некие операции с математической точки зрения) над данными, измеренными в шкалах данного класса будут некорректными. (Кстати, к статистике это не имеет никакого отношения, эти свойства и ограничения изучает другой раздел математики -"Теория измерений"). А уж тем более, вы не можете сделать никакого "углубленного анализа " например, не можете сказать, что медучреждение в одном из пунктов работают лучше, чем во втором.
2. Для того, чтобы корректно сделать такой анализ надо перейти от непосредственно измеренных параметров к косвенно измеренным параметрам, представленным в другой шкале измерений - например, в шкале отношений. Именно для этого вместо параметра "количество заболевших" вводят и анализируют параметр "уровень заболеваемости" - рассчитываемый как отношение количества заболевших к населению. Но вот тут загвоздка. Начнем с того, что "население города" - постоянно только в течении.... одного дня (а в реальности - и того меньше)! Таким образом, если нарисовать график количества людей, проживающих в городе по дням - это будет типичный временной ряд. Причем вовсе не обязательно даже стационарный, и скорее всего - не подчиняющийся нормальному закону распределения. То есть "население города" - это случайная величина, изменяющаяся ежедневно (кто-то приехал, кто-то уехал, кто-то родился, кто-то умер т.д.). Как любая случайная величина, на конечном временном отрезке (например - год) эти данные могут быть статистически ОЦЕНЕНЫ. Другими словами, параметр "среднегодовое население" - это случайная величина, котороя, естественно, имеет и среднее, и среднеквадратичное отклонение, и доверительный интервал при заданном уровне значимости и даже (хотя-бы теоретически) коэффициенты автокорреляции различных порядков. И никакое другое представление (например - точечная оценка) не является для нее математически полным.
3. Если вы какой-то параметр-константу (количество заболевших за год) делите на параметр-ОЦЕНКУ случайной величины (среднее население города за год), то результат будет -случайная величина (измеренная в более слабой из шкал). Со всеми ее необходимыми атрибутами, включая доверительные интервалы. И именно с такими данными вы уже реально можете проводить какие-то дальнейшие исследования или анализ - и сравнивать по разным регионам, и анализировать в плане исторического изменения, и делать предсказания и пр. пр. пр.
4. Вывод. "Количество заболевших" - никаких ДИ, достаточно непосредственно измеренных абсолютных данных. Но ограниченные возможности анализа и интерпретации. А вот "уровень заболеваемости" - статистическая величина с необходимым интервальным представлением параметров. Зато полная свобода для дальнейшего анализа.

Вот как-то так. Не знаю, удалось-ли мне хоть немного "популяризировать" математику, но я старался rolleyes.gif
  Форум: Медицинская статистика · Просмотр сообщения: #23534 · Ответов: 24 · Просмотров: 6025

passant
Отправлено: 30.10.2018 - 10:03


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Семен Суслов @ 30.10.2018 - 00:33) *
Хорошая книга, советую.

Браво. Вы специально сегодня зарегистрировались на форуме, что-бы похвалить эту книгу? blum.gif
Но если именно по этой книге учат медиков статистике - именно науке "статистика", а не тому, что такое "первичная заболеваемость" или почему "при наличии острого и хронического заболевания основным следует считать диагноз острого заболевания" - то я перестаю удивляться уровню понимания и вопросов, которые на этом форуме задают аспиранты и их готовности решать именно научные вопросы, связанные с интеллектуальной обработкой данных. Увы.
Давайте все-таки эту тему - если ТС, конечно не против - оставим именно книгам по статистике (как научного инструмента, включая программный) для медицины.
  Форум: Медицинская статистика · Просмотр сообщения: #23483 · Ответов: 12 · Просмотров: 4776

passant
Отправлено: 23.09.2018 - 23:12


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


...
  Форум: Медицинская статистика · Просмотр сообщения: #23355 · Ответов: 12 · Просмотров: 4776

passant
Отправлено: 23.09.2018 - 23:09


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Продолжая ранее начатую - и весьма полезную с моей точки зрения - тему приобщения к статистике новичков и не очень :-), рекомендую еще вот такую книжку:
С. Бослаф. "Статистика для всех".
http://libgen.io/search.php?req=%D0%A1.+%D...&column=def
Она хоть и для "начинающих и любопытствующих", но более серьезная. "Про котиков" в ней нет, зато есть даже отдельно-специальная глава "Статистика в медицине и эпидемиологии".
Приятного чтения. :-)
  Форум: Медицинская статистика · Просмотр сообщения: #23354 · Ответов: 12 · Просмотров: 4776

passant
Отправлено: 15.08.2018 - 18:49


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 15.08.2018 - 18:13) *
А по поводу функций принадлежности вам сюда

Ну, от функций принадлежностей до классификации на основе нечетких правил еще как до Луны.... ну, вы поняли rolleyes.gif
Если уж куда направлять свой взор по теме (нечеткая классификация и кластеризация), то скорее вот сюда, сюда, или сюда.. Только вот прежде, чем углубляться в дебри, ТС стоило бы для начала ознакомиться с азами раздела науки, которую он хотел бы задействовать в своих исследованиях. Мне так кажется (С) angel.gif
  Форум: Медицинская статистика · Просмотр сообщения: #23252 · Ответов: 32 · Просмотров: 11724

passant
Отправлено: 15.08.2018 - 17:32


Дух форума
*

Группа: Пользователи
Сообщений: 146
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Ident @ 15.08.2018 - 14:46) *
Спасибо большое, намного теплее). Не подскажите книжку, сайт и т.д., где есть примеры решения таких задач. Заранее благодарен.

Даже не знаю, что вам насоветовать... Книг, интернет ссылок, видеокурсов по тематике так много, а копировать сюда что-то из Гугла - тоскливо. И непонятно, что вас конкретно интересует - ML, теория нечетких множеств, реализация на R, на Python? Для медиков? Для экономистов?
Начал писать список, дошел до 25 источников из тех, что у меня на диске - но стер. Оставлю лишь самые базовые.
Для общего развития
- Флах Машинное обучение - наука и искусство построения алгоритмов
Фундаментальные основы.
- Ким Факторный, дискриминантный и факторный анализ
- Мандель Кластерный анализ
- Айвазян Прикладная статистика. Классификация и снижение размерности.
Современные подходы
- Барсегян Анализ данных и процессов
- Орлов Математические методы теории классификации
Для поклонников R
- Шитиков Мастицкий Классификация, регрессия и другие алгоритмы Data Mining с использованием R
Кое-что по нечетким множествам
- Павлов Принятие решений в условиях нечеткой информации
- Гончаров,Кластеризация на основе нечетких отношений. Алгоритм Fuzzy Relation Clastering
- Конышева Основы теории нечетких множеств. Для Бакалавров и специалистов
Есть даже для медиков - в соответственно адаптированном варианте
- Реброва Статистический анализ медицинских данных
- Лапач Статистические методы в медико-биологических исследованиях с использованием EXCEL
- Кочетов Методы статистической обработки медицинских данных
и т.д. до бесконечности. Все легко находится в сети :-)
Будут вопросы - задавайте
  Форум: Медицинская статистика · Просмотр сообщения: #23250 · Ответов: 32 · Просмотров: 11724

6 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена