Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

7 страниц V   1 2 3 > » 

passant
Отправлено: 4.06.2020 - 15:33


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Choledochus @ 4.06.2020 - 15:10) *
Есть данные только по средним значениям.
Есть критерий, который позволяет сравнивать выборочные средние без данных о дисперсии?
Спасибо

Если действительно, есть данные только по средним значениям и ничего более, то ничего более вы сделать не можете. Даже не можете выяснить, отличаются-ли выборочные значения между собой значимо.
  Форум: Медицинская статистика · Просмотр сообщения: #25802 · Ответов: 1 · Просмотров: 74

passant
Отправлено: 7.04.2020 - 22:30


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


.....
  Форум: Медицинская статистика · Просмотр сообщения: #25590 · Ответов: 17 · Просмотров: 1300

passant
Отправлено: 7.04.2020 - 22:28


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223




Спасибо, конечно. Если вы про книгу Sumeet Dua и Xian Du, то я ее конечно читал. С тех пор (с 2011) года вышло еще несколько очень приличных книг по теме. И приходиться постоянно держать руку на пульсе. Поэтому если что кому надо из книг по статистике, ML, DataScience, Deep Lerning - можете обращаться, чем смогу помогу (и Боже упаси при этом нарушить авторские права rolleyes.gif ) . Что такое \"БИОМЕТРИКА\" я не понял, но если это тот-же сайт, что и не несколько постов выше - то спасибо, я уже писал, что \"вынес\" с того сайта все, что мне может быть новым и интересным. :hi.gif:
  Форум: Медицинская статистика · Просмотр сообщения: #25589 · Ответов: 17 · Просмотров: 1300

passant
Отправлено: 7.04.2020 - 18:02


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Б_Т_Г @ 7.04.2020 - 16:36) *
passant, Вы не медик, а какой специалист? Мне интересно поговорить с Вами и по иному направлению.

В данный момент я занимаюсь вопросами применения методов ML в Cybersecurity.
  Форум: Медицинская статистика · Просмотр сообщения: #25587 · Ответов: 17 · Просмотров: 1300

passant
Отправлено: 5.04.2020 - 18:02


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 5.04.2020 - 16:25) *
Ну, крутенько, в общем-то замешиваете. Про многомерные обобщения тестов на единичный корень (равно как и тестов на Change Point) не читывал и поэтому навскидку не могу сказать, насколько корректно делать все это покоординатно.
И есть еще соображение-опасение: в имеющемся временном ряду можно (опять же, покоординатно) оценить условную по имеющейся предыстории 95%-ную квантиль, при пробое которой можно поднимать тревогу. Так делают при расчете показателя VaR в финансовых рядах. Однако тут надо опасаться "ложных" пробоев.


Спасибо. Подумаю над этим.
  Форум: Медицинская статистика · Просмотр сообщения: #25580 · Ответов: 17 · Просмотров: 1300

passant
Отправлено: 5.04.2020 - 17:04


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 5.04.2020 - 13:24) *
просто некая многомерная задача о разладке.

Да, близко к этому. Но классическая "разладка", та, которая тянется с теории надежности - работает либо по threshold, либо в лучшем случае по 3-м Сигмам. И то и другое - "не вкусно". С точки зрения статистики - требует жестких обоснований. Методы типа Бродского-Дарховского требуют выпонения жестких условий, которые как правило в реальной жизни нарушаются. И пр.пр.пр. Причем, если ряд становится многомерным, то все становиться совсем грустно.
Ну и еще одно - мне надо сравнивать не одномоментный "срез" рядов, а срез статистик за некоторый период наблюдения. Т.е. "пациент" объявляется больным НЕ если у него зафиксирован скачек сахара за 3 Сигмы, а если за определенный период времени зафиксированы подъем уровня сахара, изменения среднеквадратичного отклонения наполняемости кровеносной системы, средний интервал между ударами сердца и цвет губ был чаще синим, чем красным (Ой, да простят меня медики shok.gif и, я понимаю, что для вас это звучит ересью наверняка, не надо бросать в меня тапками.... sorry.gif я просто хочу растолковать суть и провести аналогию, не вдаваясь в подробности моей предметной области). И вот зафиксировав такие изменения мы принимаем решение о состоянии пациента. Про то, что он, "гад", еще и может у нас некоторые данные фальсифицировать - я уже тоже упоминал.
Но в общем да, многомерные ряды, стримминг-кластеризация с дрейфом и забыванием, "разладка" - а точнее Change Points, Anomaly and Outliers Detection и пр. И все это часто в режиме "он-лайн" и частотой фиксации параметров - несколько сотен или тысяч в секунду (хотя это вот не всегда так жестко, как раз).
  Форум: Медицинская статистика · Просмотр сообщения: #25578 · Ответов: 17 · Просмотров: 1300

passant
Отправлено: 5.04.2020 - 10:50


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 4.04.2020 - 23:44) *
Так, может, там не гипотезы надо тестировать, а подгонять модель в пространстве состояний?
Впрочем, без конкретики сложно сказать больше, чем уже сказано...

Да вроде нет :-).
Представьте - на медицинском примере - у вас один пациент, о котором вы получаете множество разных параметров - температура, давление, сахар... бла-бла-бла.
Каждый параметр - это временной ряд. По каждому временному ряду В КАЖДЫЙ ВРЕМЕННОЙ ПЕРИОД вы можете снять некоторую статистику - от элементарных средних, дисперсии и пр, до параметров моделей ARIMA, Х-В, и т.д. Некоторые параметры могут быть ранговыми, а некоторые - даже номинальными - но и для них можно снять некоторую (свою) статистику.
Итого - у нас в наличии очень многомерное пространство, в котором состояние объекта за данный период времени - это точка, а координаты ее - это значение измеренных статистик.
Теперь наступил следующий период времени, мы вновь насчитали статистики, т.е. получили вторую точку в том-же пространстве..
Затем можно сразу пытаться понять принадлежат-ли эти две точки одному кластеру. Но тут стоит вопрос - как увязать совершенно разнотипные параметры, как обосновать это различие.
Как я писал - можно пытаться нормировать все параметры. Традиционно, но семантически не совсем прозрачно. Можно в качестве меры близости использовать меры от Евклида до косинуса, но это детали.
Другой путь - рассматривать не сами параметры, а их изменения, причем не абсолютные, а как p-value тестов на различие этих значений статистики в последовательные периоды времени.
Теперь мы перешли в другое пространство, где каждая точка имеет координаты в пределах от 0 до 1, причем это семантически ясные значения, и теперь точка этого пространства - это показательизменения состояния нашего пациента между интервалами наблюдения.
Вот такая цепочка рассуждения приводит к тому, что нам надо сказать - изменение состояния, выраженное в координатах пространства значений p-values значимо или нет.
Т.е. мы можем говорить, что состояние пациента изменилось и с какой значимостью, или нет.
Еще более обще - наблюдается-ли некоторая аномалия в состоянии "пациента". (Аномалии могут быть выражены не только изменения базовых статистик, но и быть контекстно-зависимыми, групповыми и т.д. - но это отдельная тема, которую я тут пока даже не затрагиваю).
Кроме того, как я указал, мой "пациент" может вести себя настолько плохо, что может даже пытаться замаскировать некоторые параметры так, что-бы затруднить обнаружение его изменения - но это тоже другая тема, которую я я пока выношу за скобки.
Вот как-то примерно так.
  Форум: Медицинская статистика · Просмотр сообщения: #25575 · Ответов: 17 · Просмотров: 1300

passant
Отправлено: 5.04.2020 - 00:23


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 4.04.2020 - 23:00) *
По этому пункту навскидку сюда

Да, спасибо. Я уже понял, что проблема потихоньку перетекает в проблему множественной проверки гипотез, причем особенность моих задач - гипотезы разные, выполняются разными тестами но относятся к поведению (состоянию) одного объекта.

Цитата(100$)
совместное распределение координат признакового описания объекта изучается методами многомерной статистики. Нельзя с каждой координатой возиться, как котенок с клубком.
Да, в моем плане тут попробовать применить методы из области классификации и кластерного анализа. Разумеется - многомерных.

Цитата(100$)
В обоих случаях надо изучать их статистические свойства: состоятельность, несмещенность, способность удерживать заданный (номинальный) уровень ошибки I и мощность.
Спасибо, как раз накопал несколько несколько забугорных источников. Но там расматриваются в основном случаи однотипных гипотез. Буду копать дальше.
  Форум: Медицинская статистика · Просмотр сообщения: #25571 · Ответов: 17 · Просмотров: 1300

passant
Отправлено: 4.04.2020 - 21:25


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Med_Elena @ 4.04.2020 - 14:57) *
rolleyes.gif "Итак, формальная постановка задачи".
Уровень постановки задачи определяется уровнем знания самого исследователя. Причём не только знаниями по статистике, но и по знаниям в своей медицинской технологии. Т.е. когда уровни знаний формальные, то и задачи формальные.

Я и в самом вопросе и во многих моих сообщениях неоднократно подчеркивал - я НЕ медик. И "медицинские технологии" меня интересуют в последнюю очередь. За что я очень ценю этот форум - тут много специалистов именно в статистике, которые успешно применяют свои знания и опыт для решения медицинских задач. Как я свои знания применяю для решения НЕ медицинских задач. И эти специалисты часто в ходе дискуссии высказывают очень интересные и глубокие идеи, которые помогают и мне решать свои НЕ медицинские задачи и которые не попадались мне раньше. Поэтому на рекламируемый вами сайт я не пойду - ну, хотя-бы потому, что был там неоднократно и в общем-то все, что там НЕ медицинское и интересное для меня уже вычитал. Не думаю, что авторы этого сайта помогут мне в решении задач в моей предметной области. (Кстати, в другом вашем сообщении вы написали, что вот только-только нашли этот сайт, а тут уже оказывается 20 лет знакомства. Ну да ладно).
Ваш ответ, уважаемая Med_Elena несомненно очень правильный, полезный для начинающих мед.статистиков, но увы, для меня он полезной нагрузки практически не несет.

А вот уважаемым господам nokh и p2004r - огромное спасибо. Несколько интересных идей (НЕ медицинских :-) ) я уже нашел. Надо будет продумать.
Книжку, рекомендованную nokh , скачал (последнее издание, 95-го года) буду смотреть. Сведение величин эффектов - меня не совсем устраивает, потому как "мои" параметры - это ряд технических данных об одном объекте (явлении) но весьма различной природы. И "болезней" моих объектов достаточно много, причем возможно и их одновременность. А некоторые, к тому-же имеют возможность влиять и даже "подправлять" некоторые анализируемые показатели. Просто "свести" (например, нормировать) - выглядит достаточно традиционно, но трудно обоснуемо. Поэтому и возникла идея сводить через p-values, как более семантически осмысленный подход. Но в любом случае - любая информация в данном направлении интересна.

Идея p2004r перейти к "одностороннему доверительному интервалу" - немного (для меня) неожидана и интересна. Далее можно пытаться выделять кластеры в получившимся многомерном пространстве - и на основании такого анализа делать выводы (задача сопряженная с начальной).. В общем - интересно, стоит подумать. Стиль R-проектов, конечно, немного напрягает - что-бы добраться до идеи надо хорошенько просерфинговать по ссылкам - но ничего, время есть, покопаемся :-). Спасибо за наводку.

Если коллеги не возражают, то со временем я вернусь сюда с очередной порцией уточнений - может еще чего интересного "навеяте". Ну и очень надеюсь, что кто-нибудь еще примет участие в "консилиуме".
  Форум: Медицинская статистика · Просмотр сообщения: #25569 · Ответов: 17 · Просмотров: 1300

passant
Отправлено: 4.04.2020 - 00:08


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Уважаемые коллеги-медики.

Поскольку в последнее время наметился некоторый застой на этом интереснейшем форуме rolleyes.gif и что-бы несколько стимулировать активность участников, осмелюсь предложить вам проблему, которая - как я полагаю - в медицинской среде должна быть более исследована, чем в остальных областях применения статистики. Я имею ввиду практику метаанализа, которая распространена (по крайней мере мне, НЕ специализирующемуся на медицинских задачах, так кажется) в области медстатистики и которая слабо исследована в других предметных областях.

Итак, формальная постановка задачи. Необходимо подтвердить H0 гипотезу отсутствия различий между двумя наборами данных. Таких тестов проводится множество. Результаты каждого теста представлены в виде соответствующего p-value. Необходимо поставить "окончательный диагноз", т.е. основываясь на указанном наборе p-value's дать окончательную оценку относительно принятия-отклонения гипотезы. В виде некоторого "обобщенного" p-value, разумеется. Получается такая себе "многомерная проверка гипотез".

Задача - как мне видется, возможно я и ошибаюсь - имеет несколько подвариантов.

Первый и самый, наверное, простой - все тесты проводятся одним и тем-же методом. Т.е. в области медицины - множество групп пациентов, например - в различных клиниках, каждая считает и предоставляет свои данные, например, по эффективности определенного лекарственного средства. Результаты должны быть формально обобщены. Как?

Второй - оценивается два объекта (в медицинских терминах, наверное - групп пациентов) каждая по множеству разных параметров (давление, рост, вес.....). Необходимо проанализировав p-value отличия по каждому из параметров, формально определить, различаются-ли эти группы пациентов.

Третий - у нас один параметр, но тестов мы проводим много (ну, самое простое - t-Стюдента, F-Фишера, тесты на различие моментов более высокого порядка, тест на постоянство автокорреляции, тест на постоянство коэффициента Херста - не важно). И решение надо принять по совокупности p-value, полученных на разных тестах.. (Ну, например, отслеживаем изменение этого параметра у пациента во времени).

Возможно, есть и другие варианты постановки задачи, но я их пока не вижу.

Итак, вопрос. Занимается-ли медстатистика такими задачами и если да (полагаю, что так и есть), то посоветуйте пожалуйста, натолкните на работы, где такие подходы разбираются. Ну и хочу все-таки отметить, что меня интересует не медицинская сторона этих работ, а именно формально-математико-статистическая.

Заранее благодарю за любую информацию, и извиняюсь, если непрофессиональностью медицинских примеров задел чьи-то тонкие струны души :hi.gif:
Всем не хворать, а тем кто на карантине - стойко его выдержать. smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #25550 · Ответов: 17 · Просмотров: 1300

passant
Отправлено: 1.10.2019 - 15:06


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Не знаю, насколько это будет актуально, но вот наткнулся на приятную вводную статью по использованию Data Science в клинических исследованиях:
https://towardsdatascience.com/clinical-dat...on-9c778bd83ea2
Специалисты вряд ли найдут для себя что-то новое, разве что всегда полезно "перепроверить" свое понимание структуризации анализа. А вот для новичков, думаю, будет одновременно и любопытно, и полезно, и просто для понимания.
  Форум: Медицинская статистика · Просмотр сообщения: #24607 · Ответов: 12 · Просмотров: 6504

passant
Отправлено: 28.09.2019 - 22:22


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(тот кото ый @ 27.09.2019 - 17:41) *
К сожалению по ссылкам ничего не открывается ((

Почему ник мужского рода?))

Проверил. По каждой ссылке открывается страничка, которая предлагает вам на выбор несколько вариантов (зеркал) для скачивания искомых книг, или торрентов, через которые эти книги можно скачать. Ну, или у вас стоит специальная блокировка, что вряд-ли.
  Форум: Медицинская статистика · Просмотр сообщения: #24599 · Ответов: 12 · Просмотров: 6504

passant
Отправлено: 23.09.2019 - 18:05


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


аналоги теста Стьдента для дискретных данных (сравнение двух выборок) и дисперсионного анализа (сравнение трёх и более выборок)
Не уверен, что вы правильно понимаете (интерпретируете) термин "дискретный показатель", но скорее всего для вашей задачи подойдет (почти) любой непараметрический тест, начиная с Вилкоксона-Манна-Уитни.
Анализ проверки равенства медиан нескольких выборок - критерий Краскела-Уоллиса.
  Форум: Медицинская статистика · Просмотр сообщения: #24579 · Ответов: 6 · Просмотров: 1755

passant
Отправлено: 22.09.2019 - 23:04


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Ну, на форуме самостоятельно искать ответ на свой вопрос вам было лень. Но мне казалось, что в интернет искать сегодня умеют все - от младенцев до бабушек. Оказалось - нет.
Ладно, помогу вам еще раз
http://gen.lib.rus.ec/book/index.php?md5=5...D36113B31D7C3AF
http://gen.lib.rus.ec/book/index.php?md5=9...B2D6D3684CFB5A9
"Медицинскую статистику" искать для вас не буду - ибо не считаю эту книгу такой, по которой следует осваивать эту науку.
За подсказку - прошу ответить и на мой вопрос: Почему ваш ник - явно мужского рода, а аватар - ну как бы не совмем мужского :-)?
  Форум: Медицинская статистика · Просмотр сообщения: #24576 · Ответов: 12 · Просмотров: 6504

passant
Отправлено: 21.09.2019 - 22:25


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Скажите, а самостоятельно просмотреть этот форум перед тем, как задавать вопрос - что мешает?
Ну, если вы сверхзаняты, и не имеете на это ни секунды свободного времени, то сделаю это за вас:
http://forum.disser.ru/index.php?showtopic=4288
Пользуйтесь!
  Форум: Медицинская статистика · Просмотр сообщения: #24572 · Ответов: 2 · Просмотров: 1552

passant
Отправлено: 4.03.2019 - 19:07


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Б_Т_Г @ 1.03.2019 - 09:35) *
За последние 5 лет утвердили примерно 100 диссертаций, в которых как раз и есть результаты сложных многомерных методов, полученных в коллективе, руководимом Леоновым.

Простите меня, человека далекого от медицины. Но по этому посту возник вопрос.
Во-первых, разве "в коллективе, руководимом Леоновым" разрабатывают методы? Если "да", то было бы интересно узнать, что это за методы, почитать, ознакомиться, проанализировать, возможно - применять в будущем. Ведь если из вот так "На ура" легко и непринужденно принимает ВАК, то наверное, это что-то интересное и важное? И непонятно, почему "результаты сложных многомерных методов" появились в 100 каких-то (сторонних) диссертациях, а не в диссертациях членов "коллектива, руководимого Леоновым"?
Или фразу все таки надо читать, как "есть результаты ПРИМЕНЕНИЯ сложных многомерных методов, полученных в коллективе, руководимом Леоновым"?
  Форум: Медицинская статистика · Просмотр сообщения: #23772 · Ответов: 10 · Просмотров: 3354

passant
Отправлено: 20.02.2019 - 23:54


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(зоо @ 20.02.2019 - 17:56) *
Подскажите, пожалуйста, пошагово, как работают Алгоритмы k-mean и случайного леса, без формул, ссылки на вики не нужны) сам умею вики смотреть, а там одни формулы
Интересует словесное описание работы этих методов

k-mean
шаг первый
вторый

случайный лес
шаг первый
второй


Ну, это примерно как просьба рассказать, как выполняют операцию по удалению аппендицита на словах и не употребляя медицинские термины.

Но если кратко - то и k-mean относится к алгоритмам кластеризации (обучение без учителя).
Первый шаг - в пространстве описания объектов вводится мера подобия (расстояния).
Второй шаг - берется множество объектов, задается желаемое количество кластеров. Назначаются произвольные точки в качестве центроидов кластеров.
Шаг третий. Как только набор центроидов становится доступен, каждый кластер обновляется таким образом, чтобы содержать точки ближайшие к данному центроиду.
Шаг четвертый. Как только набор кластеров становится доступен, каждый центроид пересчитывается, как среднее значение всех точек, принадлежащих данному кластеру.
Шаги 3 и 4 повторяются, пока кластеры и центроиды не перестанут изменяться.
Все проще простого, и без всякой математики.

Случайный лес. Относится к алгоритмам классификации (обучение с учителем).
По сути это совместное применение множества решающих деревьев.
Шаг первый. Выбирается подвыборка обучающей выборки и по ней строится дерево. При построении дерево для каждого узла случайно выбираются наборы признаков из которых по определенному критерию ищется лучший. Этот шаг повторяется многократно для различных подвыборок обучающей выборки. В итоге получаем множество деревьев.
Шаг второй. Берем полученное множество деревьев, берем объект классификации и пытаемся решить задачу каждым из деревьев. Ответы усредняем (обычно - в случае регрессии), или принимаем решение по принципу голосования (обычно - в задачах классификации).
Как вы просили - просто, словесно и без математики.

Но если честно, я не понимаю, если вы "сами умеете читать вики", то зачем вам еще словесное описание? Только не говорите, что хотите научиться этим "премудростям" без изучения математики и формул. Я же не хочу научиться удалять аппендицит по вашему описанию операции, без предварительно серьезного изучения анатомии, физиологии, диагностики и еще чего-то там, что составляет "таблицу умножения" медицины.
  Форум: Медицинская статистика · Просмотр сообщения: #23750 · Ответов: 1 · Просмотров: 1037

passant
Отправлено: 7.02.2019 - 16:58


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(comisora @ 7.02.2019 - 12:37) *
Я подумал, что это из области MCA/PCA/MDS

Вообще-то это из области Теории принятия решений. Только там формальные методы формальны настолько,что если просто "сравнить два конкретных предложения" - то огород городить замаетесь (Формирование множества возможных решений, Формирование критериев оценки, Построение индикаторов, Оценка решения по заданным критерием, Функция полезности, Выбор наилучшего решения, Обобщение мнения экспертов, Способы учета неопределенности .... бррррр). Есть даже специальный класс программ - СППР (Системы Поддержки Принятия Решений). Если вдруг собрались глубоко вникать - ну так на математических специальностях (в упрощенном виде - на менеджменте тоже) в университетах на эту тему целые курсы есть, или даже несколько. И учебников - достаточно. Копайте, если надо. Главное - не закопаться wink.gif
  Форум: Медицинская статистика · Просмотр сообщения: #23722 · Ответов: 7 · Просмотров: 2498

passant
Отправлено: 28.01.2019 - 20:47


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Я не врач, поэтому не могу обсуждать, продуктивен или нет подход, который хочет применить ТС. Более того, я уверен, что если-бы у него было больше признаков, то можно было бы и более мощные критерии применять, и более точные результаты получать. Хоть самостоятельно, хоть обратившись к профессионалам.
Однако, просто прочитав вопрос (возможно - учебный), хочу сразу же просто указать ТС, что он ошибается в той части, где пишет что можно использовать только четехпольную таблицу. На самом деле таблица может быть "сколько-угодно-польная". Я специально попытался найти обсуждение этого вопроса именно для врачей.
https://lit-review.ru/biostatistika/kriteri...kvadrat-pirsona
https://cyberleninka.ru/article/n/analiz-poryadkovyh-dannyh
Посмотрите также известную книгу В.М. Зайцев и др. "Прикладная медицинская статистика". На стр.303 есть пример весьма подобный вашему.
Можно - при необходимости- и другие источники поискать.
Так что в поставленной формулировке решение задачи "по зубам" даже студенту-медику. На сколько его можно применять в реальных врачебных ситуациях - оставляю для обсуждения профессиональным медикам.
  Форум: Медицинская статистика · Просмотр сообщения: #23697 · Ответов: 6 · Просмотров: 1866

passant
Отправлено: 23.01.2019 - 17:03


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(зоо @ 23.01.2019 - 12:50) *
passant, что означает значение 20.19952, и что нам дает sigma.t? как эти значения интерпретировать.

Ну, я так понял, что приведенную мною ссылку вы так и не прочитали. Жаль.
Иначе вопрос был-бы, не "что означает занчение 20.19952", а "почему оно именно 20.19952", что явно не совпадает с приведенными в файле исходными данными.
  Форум: Медицинская статистика · Просмотр сообщения: #23678 · Ответов: 4 · Просмотров: 1671

passant
Отправлено: 22.01.2019 - 20:01


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(зоо @ 21.01.2019 - 14:56) *
Я решил создать новую тему,чтобы не захломлять предыдущую.
Я в R провел этот анализ и получил такие результаты/ Что значит эта условная дисперсия и как проинтерпретировать
predict(b, n.ahead = 10)
# meanForecast meanError standardDeviation
# 1 20.19952 20.82351 20.82351
# 2 20.19952 20.84651 20.84651
# 3 20.19952 20.86948 20.86948
# 4 20.19952 20.89243 20.89243
# 5 20.19952 20.91535 20.91535
# 6 20.19952 20.93825 20.93825
# 7 20.19952 20.96112 20.96112
# 8 20.19952 20.98396 20.98396
# 9 20.19952 21.00679 21.00679
# 10 20.19952 21.02959 21.02959

Почему meanForecast имеет одни и теже значения?
Если необходимо, могу код в R дать.

Мы можем только догадываться, что там вы реально написали в своем скрипте, но вопрос ваш периодически задают те, кто начинает заниматься анализом рядов. Ну, например:
https://stats.stackexchange.com/questions/1...ng-arima-models
Так что "все нормально".
Единственное, что меня круто напрягает, это то, что данные в вашем файле находятся в диапазоне примерно 3734.0-3740.0 а вот meanForecast каким-то чудом оказывается равным 20.19952. Я бы при таких ответах первым делом бы полез в (свой) код искать, в чем дело?
  Форум: Медицинская статистика · Просмотр сообщения: #23675 · Ответов: 4 · Просмотров: 1671

passant
Отправлено: 22.01.2019 - 17:27


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Вот, совершенно случайно наткнулся на статью о выявлении сезонности в коротких рядах. С примерами. Обратите внимание, что такое "короткий" и на сколько "долгосрочный" прогноз при этом можно сделать.
https://robjhyndman.com/hyndsight/tslm-decomposition/
  Форум: Медицинская статистика · Просмотр сообщения: #23674 · Ответов: 21 · Просмотров: 6346

passant
Отправлено: 19.01.2019 - 22:18


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(зоо @ 19.01.2019 - 17:03) *
passant, почему нет? Можете обосновать? и на каких- Да?

Вы не рекордсмен - вот тут https://toster.ru/q/596402 некто даже по данным двух(!!!) месяцев пытается предсказать покупки сезонного товара на пол года вперед. А у вас аж по 8 месяцам и всего на два года. Да лЁгко! :-)
Если серьезно - то ваш вопрос перевернут с ног на голову.
Вы прямо спросили- "можно?". Я столь-же прямо ответил - "нет". Если более расширенно, то "нет, при имеющихся исходных данных сделать прогноз на заданный период упреждения с разумной и практически осмысленной точностью невозможно". Вы ставите такой ответ под сомнение? Тогда будьте любезны обоснуйте, на основании информации из каких источников вы считаете его некорректным и с помощью каких инструментов вы планируете делать то, что я считаю невозможным. Невозможным, ибо это противоречит как методическим основам предикативного анализа, так и обычной человеческой логике.
  Форум: Медицинская статистика · Просмотр сообщения: #23671 · Ответов: 21 · Просмотров: 6346

passant
Отправлено: 17.01.2019 - 14:02


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(зоо @ 17.01.2019 - 12:20) *
Ну например на таких данных,месячные продажи.

прогноз на два года корректно делать?

Нет.
  Форум: Медицинская статистика · Просмотр сообщения: #23669 · Ответов: 21 · Просмотров: 6346

passant
Отправлено: 29.12.2018 - 12:51


Дух форума
*

Группа: Пользователи
Сообщений: 156
Регистрация: 27.04.2016
Пользователь №: 28223


Вообще-то на первых страницах любого учебника по прогнозированию на основе временных рядах объясняется, что вопрос
Цитата(зоо @ 29.12.2018 - 00:37) *
какие модели лучше для долгосрочного прогнозирования, а какие для краткосрочного или разницы нет

безотносительно к предметной области лишен всякого смысла.
Скажите, для предсказания экономического развития страны один месяц это краткосрочный прогноз или долгосрочный? А для предсказания курса тугрика к доллару? А для предсказания состояния больного? А больного сахарным диабетом или больного, привезенного с сердечным приступом по скорой?
А вы даже не сказали нам в какой области медицины (?) вы работаете.
Наиболее интуитивно-понятную (но не временнО-упрощенческую) дефиницию периодов статистического прогнозирования я встречал вот примерно такую:
" Термины "кратко-", "средне-" и "долго-" не имеют чёткого определения, но должны зависеть от инерционности (способности объекта сохранять свои характеристики в некоторых пределах в течение заданного промежутка времени при незначительных внешних воздействиях на объект) объекта исследования.
Так краткосрочным можно назвать прогноз, осуществляемый на срок, не превышающий период инерционности объекта исследования. Главное, что характеризует этот тип прогноза - это то, что исследуемый объект (процесс)сохраняет свою устойчивость. Он не подвержен существенным изменениям и может быть достаточно точно спрогнозирован. Прогнозные методы в случае с краткосрочным прогнозированием должны в большей степени учитывать последние полученные данные.
Среднесрочный прогноз - это прогноз на срок, незначительно превышающий период инерционности объекта исследования. В этом случае в динамике показателя может наметиться какая-нибудь тенденция, в частности - изменения параметров модели процесса, которую можно выловить и спрогнозировать с помощью соответствующих математических методов.
Долгосрочный прогноз - это прогноз на срок, значительно превышающий период инерционности. Здесь уже динамику показателя спрогнозировать становится практически невозможно: за этот срок может произойти существенное, случайное и абсолютно непредвиденное заранее изменение в поведении объекта исследования. Именно поэтому для прогнозирования на долгий срок нужно обращаться к различным сценариям и использовать в том числе экспертные методы для выбора оптимистичного, пессимистичного и наиболее вероятного из них.
Методы расчёта периода инерционности объекта исследования пока практически не разработаны, так что его приходится оценивать "на глаз". Более того, период инерционности очевидным образом меняется от одного объекта исследования к другому.
" (--->отсюда, кстати, понятно, почему в приведенных выше примерах при одинаковых периодах упреждения сами прогнозы будет относиться к принципиально разным типам и должны выполняться разными математическими или эвристическими инструментами.)
Это определение возможно не совсем четкое в математическом смысле, зато дает исследователю хоть какие-то ориентиры.
Поэтому если вы хотите осмысленных ответов - приведите семантику вашей задачи. Думаю тогда можно будет предметно говорить и о типе вашего прогноза и о методах, которые имеет смысл применять.
  Форум: Медицинская статистика · Просмотр сообщения: #23619 · Ответов: 21 · Просмотров: 6346

7 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена