Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

28 страниц V   1 2 3 > » 

100$
Отправлено: 6.07.2019 - 16:25


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
Не обижайтесь, но у вас второе предложение противоречит первому.


Да какие уж тут обиды ). Но вы окажете мне большую услугу, если воспримете норму не как придуманную мной наспех сущность (ее ввели в оборот сильно задолго до меня), а как способ восстановления пропущенных значений во временном ряду.

Цитата
А "норма" у крысы, как и у человека, представляет собой диапазон значений, а не одно число.
Первый попавшийся пример... - уровень холестерина от 40 до 130 является "нормальным".


Чистая правда. Которая кроме сказанного означает, что любое число из этого диапазона является решением задачи. Н-р, всем известная структурная средняя по имени "медиана" при нечетном объеме выборки представляет собой интервал, являющийся решением, каждая точка которого, в свою очередь, тоже является решением.



Цитата
Поэтому в доклиническом исследовании трудно вообразить адекватный эксперимент без контрольной группы (обычно контролей еще и несколько) и/или измерения начальных значений изучаемых параметров.
Если копнуть еще глубже, то показатели биохимии имеют свойство серьезно меняться в зависимости от времени года и от диеты (крыса - животное деликатное, хуже только кролик). Плюс гендерные различия. Плюс линейные крысы разных линий тоже различаются


Это всё - статистически усредняемые параметры. И все они известны, и в конечном итоге формируют некий информационный фон, теоретический костыль, без которого любой экспериментатор будет попусту крыс переводить на компост.
  Форум: Медицинская статистика · Просмотр сообщения: #24164 · Ответов: 13 · Просмотров: 1114

100$
Отправлено: 5.07.2019 - 16:26


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(ogurtsov @ 5.07.2019 - 14:15) *
Для биохимии нету нулевой точки, то есть "как биохимия мозга зависит от глубины воздействия стресса" мы не узнаем в ходе данного эксперимента.


Не надо плодить сущности. Есть понятие физиологической нормы. "Нулевой точкой" является вектор интересующих исследователя показателей биохимии, соответствующий физиологической норме (т.е. полученных от животных, не подвергавшихся никакому стрессовому воздействию). Применительно к обсуждаемому дизайну можно допустить, что показатели физиологической нормы известны и автору темы, и его коллегам со времен царя Гороха. Он же не Робинзон Крузо, варящийся в собственном соку на необитаемом острове.

Только эта норма в данном случае и не нужна.Как не нужна здесь и контрольная группа. Мы просто берем и начинаем угнетать психику стрессовым воздействием. И три набора показателей биохимии мозга, полученных на разных уровнях непрерывного по природе фактора "степень предпочтения сахарозы", выступающего в качестве ковариаты, - экспериментальный факт. Вот вас и просят протестировать гипотезу о случайности наблюдаемых различий.
  Форум: Медицинская статистика · Просмотр сообщения: #24159 · Ответов: 13 · Просмотров: 1114

100$
Отправлено: 5.07.2019 - 13:53


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
Ну а животных-то зачем убивать?


Чтобы снять у них биохимию мозга. Живой-то особи в башку не зелезешь...

Цитата
У вас цель состояла в анализе предпочтения сахарозы


Как по мне - так ничего подобного. Есть стрессогенный фактор, есть время. Об уровне воздействия стрессогенного фактора с течением времени судят по косвенному показателю - степени предпочтения сахарозы. После чего пытаются понять:как биохимия мозга зависит от глубины воздействия стресса. Усреднение уровня сахарозы будет происходить сначала по 15 объектам выборки, затем - по 10 и т.д. (ковариата). А собственно биохимия (дисперсионный комплекс в данном случае) будет представлена тремя независимыми выборками по 5 убиенных крыс. Погибших во имя науки.
  Форум: Медицинская статистика · Просмотр сообщения: #24157 · Ответов: 13 · Просмотров: 1114

100$
Отправлено: 21.05.2019 - 13:32


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 21.05.2019 - 12:57) *
Уже настроился с бутстрепом для Жаккара разбираться (т.к. с первого раза по аналогии с прописями не вышло), поэтому просто не догадался про ДИ для частот. Про Жанга - Ли ещё не слышал, использую в последнее время байесовский априорный интервал Джеффриса. Есть в онлайновом калькуляторе EpiTools (http://epitools.ausvet.com.au/content.php?page=CIProportion , здесь же ссылка на статью с формулами), также добавил его в экселевский калькулятор плава (Доверительный интервал для долей.xls в папке Программы к Практикуму: https://yadi.sk/d/g50i73pt3J6pAa).


Э-х-х, про Джеффриса-то я и забыл.

Кстати, глянул на данные из Ассоциации_2012.xls и при виде кучи столбцов из нулей и единиц тотчас вспомнил про дискриминантный анализ в пространстве дихотомических переменных из статьи Гибба и Штриммера 2015 г. См. пакет {binDA} для R и сопроводиловку к нему. Там приятным для глаз бонусом идет способность метода ранжировать предикторы по важности с выдачей соответствующей гистограммки.
  Форум: Медицинская статистика · Просмотр сообщения: #23977 · Ответов: 13 · Просмотров: 1829

100$
Отправлено: 21.05.2019 - 11:33


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 20.05.2019 - 22:06) *
С 95% ДИ для Жаккара и бутстреп-оценками р по ДИ повожусь когда будет больше времени.


А зачем? Индекс Жаккара идейно представляет собой просто долю объектов с одновременной совстречаемостью признаков в выборке, из которой предварительно исключены объекты с их (признаков) одновременным отсутствием. Почему бы просто не рассчитать ДИ для доли: Клоппера - Пирсона, Уилсона, Агрести - Коула, арксинуса, ... вот недавно открыл для себя ДИ по Жангу - Ли?

Просто интересно.
  Форум: Медицинская статистика · Просмотр сообщения: #23974 · Ответов: 13 · Просмотров: 1829

100$
Отправлено: 20.05.2019 - 22:16


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 20.05.2019 - 22:06) *
Огромное спасибо! Теперь мои студентки смогут сами посчитать значимость в Excel yahoo.gif
Вставил вашу формулу в R:

Jaccard <- function (x, y)
{
C11 <- sum(x == 1 & y == 1)
A10 <- sum(x == 1 & y == 0)
B01 <- sum(x == 0 & y == 1)
N<-(C11+A10+B01)
mysum<-0
for(x in 0:(C11-1))
{
mysum<-mysum+choose(N,x)*(2^(N-x))
}
return(list(Jaccard.index=(C11/N),
"p.value"=(1-mysum/(3^N))))
}

#Пример
> a<-c(1,1,1,1,1,0,1)
> b<-c(1,1,1,1,1,1,0)
> Jaccard(a,b)
$`Jaccard.index`
[1] 0.7142857

$p.value
[1] 0.04526749

Задача решена, тему можно считать закрытой.
С 95% ДИ для Жаккара и бутстреп-оценками р по ДИ повожусь когда будет больше времени.


Здорово, nokh. Не знал про choose(). Думал, что комбинаторику придется делать по старинке через факториалы. Ну, все к лучшему.
  Форум: Медицинская статистика · Просмотр сообщения: #23972 · Ответов: 13 · Просмотров: 1829

100$
Отправлено: 20.05.2019 - 16:51


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 19.05.2019 - 22:09) *
Будем рады такому подарку!


Тогда ловите. С нашего стола вашему столу ).

Файл с поддержкой макросов в формате .xlsm. Открывать Экселем не старше 2007-го. Если настройки безопасности заблокируют макросы, то надо через центр управления безопасностью разрешить их выполнение.
Пользоваться очень просто: либо в затененном месте с пометкой "Исходная таблица сопряженности" заносите свои данные, либо для произвольной предварительно сделанной таблицы сопряженности выделяете на любом листе в рабочей книге строку о двух столбцах, вносите туда функцию "Jaccard" следующим образом: "=Jaccard()" (без кавычек) и указываете в качестве ее аргумента таблицу сопряженности 2х2. (Синтаксис можно увидеть, встав на ячейку Е10). Затем нажимаете комбинацию клавиш "Ctrl+Shift+Enter". Функция вернет массив, первым значением в котором будет индекс Жаккара, а вторым - p-value. И вся любовь.
Прикрепленные файлы
Прикрепленный файл  Жаккар.rar ( 13,59 килобайт ) Кол-во скачиваний: 18
Прикрепленный файл  Жаккар.rar ( 13,59 килобайт ) Кол-во скачиваний: 19
 
  Форум: Медицинская статистика · Просмотр сообщения: #23969 · Ответов: 13 · Просмотров: 1829

100$
Отправлено: 19.05.2019 - 14:12


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
Буду разбираться и пытаться программировать, хотя скорее всего здесь у меня из R получится BASIC.


Вряд ли R в этой истории будет предпочтительней VBA, поскольку в Экселе ф-ция =ЧИСЛКОМБ() работает, как минимум, не хуже. Если что, могу написать вам на VBA формулу для расчета и Жаккара и p-value к нему. Так сказать, мой подарок челябинским братьям по разуму. Если что, факториалы в R - это просто factorial(число). Факториалы вам понадобятся для комбинаторных расчетов.


Цитата
А что вы думаете по поводу такого подхода: удалить из набора данных строки двойных нулей (ячейка D) и считать Монте-Карло или exact только оставшиеся ячейки?


Дума здесь на удивление проста: если есть возможность за обозримое время вычислить точное значение методом перебора всех перестановок - то предпочту ее (возможность). Тем более, что формулы (16) и (17) - ровно о том же.
И все это только потому, что в идеале для монтекарловских p-value необходимо строить еще и доверительный интервал. Это в принципе несложно, но программисту возни немного больше.

P.S. А пакет jaccard у меня не загрузился. Начал требовать наличия на компе компиляторов C/C++.
P.P.S. А как работает этот пакет - вообще не понял, ибо не нашел в описании не только рабочих формул или вменяемых описаний алгоритмов, но даже ссылок на соответствующие источники.
  Форум: Медицинская статистика · Просмотр сообщения: #23966 · Ответов: 13 · Просмотров: 1829

100$
Отправлено: 17.05.2019 - 20:53


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 17.05.2019 - 00:17) *
Провели анализ микробных ассоциаций в ожоговых ранах, выборка хорошая - более 400 проб. При оценке значимости ассоциаций с помощью индекса Жаккара в R-пакете jaccard выявилась такая штука: относительно большие индексы могли оказаться незначимыми (J=0.32; Р=0,504), а почти нулевые - значимыми (J=0.06; P=0.049). Если интересно - могу выложить данные, хотя я понял почему так происходит и сделал простой маленький пример. Стал искать другие пути, но не получается справиться самостоятельно. Буду очень признателен за помощь. Описание проблемы и вопросы в прикреплённом файле Help. Второй файл - статья, на которую есть надежда. Может ещё какие варианты подскажите...



По поводу формул (16) и (17) из статьи - да все правильно: VR3,N=3^N по ф-ле (14). Соответственно, VR2,N-x=2^(N-x). Оба этих коэффициента получены в предположении, что D=0, откуда делаем единственно возможный вывод, что применительно к нашему случаю N=A+B+C+0=A+B+C. Можете смело программировать. К слову, для рассматриваемой в качестве примера таблицы с(5,1,1,0) для J=,71428571 вычисления по формуле (17) дают p-value=.045267. При всем при том, что тест отношения правдоподобия для этой таблицы статистически не значим.
  Форум: Медицинская статистика · Просмотр сообщения: #23962 · Ответов: 13 · Просмотров: 1829

100$
Отправлено: 12.05.2019 - 14:54


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 11.05.2019 - 22:05) *
Насколько корректно применять анализ главных компонент к временным рядам? Полазил по зарубежным форумам и увидел разные мнения. То, что так считают и есть много публикаций - факт, однако PCA основан на корреляциях, для которых требование независимости наблюдений в выборке нарушена. Хочу применить к медицинским данным: динамика изменения 5-7 показателей (температура, ЧСС, АД и др.) у отельного пациента в течение 30 дней после операции.


Предварительный диагноз - корректно. Не знаю, что такое Time-Wise PCA в Statistica, но навскидку нагуглил вот такую симпатичную статью:здесь
  Форум: Медицинская статистика · Просмотр сообщения: #23947 · Ответов: 6 · Просмотров: 1149

100$
Отправлено: 27.04.2019 - 22:27


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Конечно, можно. А (уважаемому) председателю тактично сообщить, что за корректность расчетов несет ответственность не статпакет, а - horribile dictu! - исследователь. Как он нес ее в докомпьютерные времена. Вооружившись калькулятором.
  Форум: Медицинская статистика · Просмотр сообщения: #23911 · Ответов: 1 · Просмотров: 940

100$
Отправлено: 18.04.2019 - 20:47


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(alina.K @ 18.04.2019 - 12:23) *
Всё, вы очень помогли. А почему МАНОВА требует чтобы M-BOX не был стат значим, что говорит о том, что многомерные методы уместно использовать. а линейный ДА не требует.


Линейная модель требует гомогенности ковариашек, квадратичная (то бишь нелинейная) - нет.
  Форум: Медицинская статистика · Просмотр сообщения: #23905 · Ответов: 7 · Просмотров: 1398

100$
Отправлено: 17.04.2019 - 20:50


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(alina.K @ 17.04.2019 - 14:33) *
100$, а можете подсказать как интерпретировать эту строчку априорных вероятностей.
Prior probabilities of groups:
setosa versicolor virginica
0.3619048 0.3333333 0.3047619
что значит setosa 0,36


Да, это доля каждого конкретного сорта в обучающей выборке. Иначе говоря, в вашей обучающей выборке из 105 цветков было 38 сетоз. Откуда a priori p(Setosa)=38/105=.3619048...


Цитата
А также как мне интерпретировать постериорные вероятности?
p=predict(z,test)
posterior
setosa versicolor virginica
22 1.000000e+00 5.966703e-20 5.555393e-41
23 1.000000e+00 1.638449e-24 5.197733e-48
25 1.000000e+00 4.449308e-16 1.260953e-36


Да так и интерпретировать, что построенное по обучающей выборке классифицирующее правило объекты тестовой выборки с номерами 22, 23 и 25 считает принадлежащими классу Setosa с единичной вероятностью.
  Форум: Медицинская статистика · Просмотр сообщения: #23903 · Ответов: 7 · Просмотров: 1398

100$
Отправлено: 13.04.2019 - 14:44


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(alina.K @ 13.04.2019 - 13:08) *
100$, благодарствую)
но что - то в
>z не вижу, где тест М-Бокса?
Как мне его высчитать? Если он стат.значим, все не очень хорошо. Если я правильно поняла.


М-тест Бокса:

>library(biotools)
>boxM(data, grouping)

По поводу равенства/неравенства ковариашек могу сообщить, что, н-р, квадратичный ДА его и не предполагает.
  Форум: Медицинская статистика · Просмотр сообщения: #23895 · Ответов: 7 · Просмотров: 1398

100$
Отправлено: 12.04.2019 - 23:27


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


1. Лямбда Уилкса:
> library(rrcov)
> Wilks.test(Species~.,train)

Для всего остального достаточно просто подать команду:
> z

А познавательная команда str(z) покажет структуру этого объекта: сразу становится видно, до каких полей необходимо "достучаться" с помощью "$".
  Форум: Медицинская статистика · Просмотр сообщения: #23893 · Ответов: 7 · Просмотров: 1398

100$
Отправлено: 31.03.2019 - 15:03


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nastushka @ 31.03.2019 - 12:39) *
Да, я хелп читала, но там просто описание метода, а не принцип работы


Тогда вот это

Комбинация этих ссылок - ответ не только на прозвучавшие вопросы, но и на могущие возникнуть.
  Форум: Медицинская статистика · Просмотр сообщения: #23868 · Ответов: 3 · Просмотров: 1126

100$
Отправлено: 30.03.2019 - 20:44


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nastushka @ 30.03.2019 - 19:58) *
Подскажите в Statistica 10 реализован метод feature Selection. Я прикрепила скрин. в R есть библиотека Boruta
Я хочу понять по какому принципу работает этот метод. Как он выявляет какие из независимых переменных влияют на зависимую?
И почему бывают такие ситуации, когда
1. он считает что все переменные сильно связаны с зависимой
2. А также если взять в модель те переменные, которые метод выбрал, модель(не важно, нейронные сети, логистическая....................) может быть низкого качества в плане классификации. Ведь FS же показал переменные, что влияют.



Ознакомьтесь
  Форум: Медицинская статистика · Просмотр сообщения: #23865 · Ответов: 3 · Просмотров: 1126

100$
Отправлено: 27.03.2019 - 21:03


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(aknothing @ 27.03.2019 - 08:36) *
Вы не совсем правильно поняли вопрос мне задававшийся. Выборка у исследователя одна и просит он сравнить доли в этой одной выборке. Ни о проверке равномерности распространения этих патологий в популяции, ни о сравнении двух групп, ни о влиянии каких-либо факторов речи не шло. Как не было и вопроса по оценке полученных результатов (гипотеза о равенстве доли единиц, обладающих определенным признаком, норме). Вот человек выше правильно подсказал, что "допустим, с медицинской точки зрения действительно важно доказать, что патологии представлены неравномерно." Я предполагаю, что именно это и требуется. Но если Вы видите иное решение, то был бы благодарен, если его как-то подскажете.


Полагаю, что понял правильно, бо меня о том же самом просили не раз. Если бы выборка состояла из объектов типа М и Ж (мягкие и жесткие), то исследователь наверняка захотел бы узнать, а сбалансирована ли его выборка по полу? Вы же стоите перед урной, в которой находятся 100 шаров трех разных цветов и 100 раз проделываете эксперимент, заключающийся в добывании из урны шара определенного цвета, причем вероятность pi извлечения шара конкретного цвета вам неизвестна. Вас просят протестировать гипотезу о том, что вероятность наблюдать вектор из имеющегося набора эмпирических частот не отличается от 1/3 против альтернативы о том, что таки отличается.
Разумеется, тестировать ее попарными сравнениями типа 1 vs. 2, 1 vs. 3 и 2 vs. 3 не резон.
  Форум: Медицинская статистика · Просмотр сообщения: #23855 · Ответов: 9 · Просмотров: 1965

100$
Отправлено: 26.03.2019 - 20:36


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(aknothing @ 26.03.2019 - 15:44) *
Тут похоже замес в плане неадекватности и недостаточного понимания аспирантом требований. Человек конкретно хочет сравнить процентное соотношение одной патологии с процентным соотношением другой в этой общей выборке и получить достоверность (грубо говоря одну цифру с другой), затем 1 с 3-й патологией, 2 с 3 и по ним так же получить значение достоверности. А потом еще 1-ю с 2+3 и тд.. на этом как-то терпение лопнуло..smile.gif


Как математик математику: проверка гипотезы о средней и проверка гипотезы о доле - квинтэссенция выборочных исследований. Ваше терпение лопнуло слишком рано.
  Форум: Медицинская статистика · Просмотр сообщения: #23846 · Ответов: 9 · Просмотров: 1965

100$
Отправлено: 5.03.2019 - 20:37


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Valeri @ 5.03.2019 - 11:19) *
Какой лучше выбрать статистический метод для разделения выборки на несколько групп.
Группы необходимо сформировать по направленности изменения параметра. Например, у обследуемых людей регистрируем артериальное давление, ЧСС в состоянии покоя, затем предъявляем им нагрузку, и после нагрузки снова регистрируем данные показатели. Необходимо выделить группы людей по схожим изменениям АД и ЧСС при нагрузке, какой корректнее использовать статистический метод.


Если размерность задачи равна двум (т.е. интересуют только два регистрируемых параметра), то задача может оказаться до смешного простой: по схеме "до-после" рассчитываем разность для каждого изучаемого параметра, для полученного двумерного распределения разностей на диаграмме рассеяния (scatterplot) пытаемся обнаружить линейные и нелинейные скопления/сгущения, и, если таковых не обнаруживаем, то, значит, задача кластеризации не имеет решения, возможна только группировка. Ну, а уж в группировке может помочь то, как данные рассыпались по соответствующим квадрантам: I (где оба знака изменения положительны), II,III и IV. В дальнейшем для этого двумерного распределения можно посчитать описательные статистики: коэффициент корреляции, взаимную информацию, вероятность попадания в первый квадрант, двумерную плотность, двумерную функцию распределения.
  Форум: Медицинская статистика · Просмотр сообщения: #23781 · Ответов: 7 · Просмотров: 2689

100$
Отправлено: 21.02.2019 - 22:50


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(metalmary @ 21.02.2019 - 19:29) *
Народ, help.gif плиз! Есть данные в абсолютных числах, нужно среднее арифметическое перевести в процент от начального значения (контроля, принятого за 100 процентов). Как пересчитать стандартную ошибку среднего относительно процентов? Например. среднее значение составило 4.57+-1.25, это составило 125,1 %+-... процентов от контроля. Видела такое в некоторых зарубежных статьях. Как это пересчитать.?


Ох, гуманитарии, вы гуманитарии... Учить вас - только портить. А ведь в школьном курсе математики пропорции идут сразу после таблицы умножения.

Есть в статистике относительная величина под названием "показатель точности опыта", численно равная отношению стандартной ошибки среднего к этому самому среднему. Смекаете, к чему это я?
А к тому, что при любом пересчете среднего показатель точности опыта останется постоянным. В данном случае =1,25/4,57=,273523. Потом умножаем его на 125,1 и получаем окончательный результат: 125,1 +- 34,22. А уж если умножить 34,22 да на 1,96 - тут до полуширины непараметрического 95%-ного доверительного интервала для среднего - рукой подать.
  Форум: Медицинская статистика · Просмотр сообщения: #23754 · Ответов: 4 · Просмотров: 1274

100$
Отправлено: 31.12.2018 - 17:09


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(зоо @ 31.12.2018 - 16:11) *
Хороший вопрос по поводу того что считать кратко-долгосрочностью
Ну смотрите к примеру есть ряд за 3 года (36 месяцев) по продажам. предсказание на три месяца это краткосрочный прогноз? а на 20 месяцев?
или например есть данные по валютам, поминутно агрегированные. В дне 1440 минут. будет ли прогноз от начала дня на на 10 часов т.е. 600 минут вперед долгосрочным?
Как определить что краткосрочным является, а что долгосрочным?


Все ваши страдания по пустякам проистекают от незнания давным-давно отлитой в граните эконометрической мудрости: к прогнозированию допускаются модели, у которых на заданном горизонте прогноза MAPE <10%.
  Форум: Медицинская статистика · Просмотр сообщения: #23622 · Ответов: 21 · Просмотров: 4895

100$
Отправлено: 29.12.2018 - 02:35


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(зоо @ 29.12.2018 - 01:37) *
100$, подскажите, пожалуйста, для моделей экспоненциального сглаживания и АРИМЫ, есть ли предпочтения по кратко и долгосрочному прогнозу? Например, какие модели лучше для долгосрочного прогнозирования, а какие для краткосрочного или разницы нет


Модель экспоненциального сглаживания (ЭС) - это способ механического (не статистического) выравнивания временного ряда, в то время как АРИМА - полноценная статистическая модель. Это означает, что у экспоненциального сглаживания нет такого понятия как дисперсия прогноза, а у АРИМ'ы - есть. Для ответа на собственные вопросы вам надо смоделировать временной ряд, для части этого ряда (н-р, 80% его длины) подогнать АРИМУ и ЭС, на оставшихся 20% сделать прогноз и рассчитать его дисперсию. Ничего более интересного предложить не могу. Сам ЭС всерьез никогда не воспринимал.
  Форум: Медицинская статистика · Просмотр сообщения: #23618 · Ответов: 21 · Просмотров: 4895

100$
Отправлено: 28.12.2018 - 23:10


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(зоо @ 28.12.2018 - 17:35) *
Подскажите, а всегда ли надо избавлять ряд от тренда?


Ну, "всегда" - вряд ли, но поскольку дальше всего удалось продвинуться в изучении именно стационарных рядов, то предварительно остационарить ряд обычно невозбранно.
  Форум: Медицинская статистика · Просмотр сообщения: #23616 · Ответов: 21 · Просмотров: 4895

100$
Отправлено: 26.12.2018 - 15:10


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(зоо @ 26.12.2018 - 11:16) *
А реализация критерия Фостера-Стюарда есть в R?


/справочно/

Традиционно при анализе временных рядов под словом "тренд" разумеют тренд среднего, тренд дисперсии или тренд а/корреляции. Гипотеза о неизменности во времени этих вероятностных характеристик известна как гипотеза стационарности временного ряда. Поэтому мейнстримом в этом вопросе является уже упомянутая бездонная тема под общим названием "Unit Root Testing". Вот ее-то и надо изучать. Патамушта ряд работ, опубликованных Дики и Фуллером в 1976-1979 гг. обнулил все антикварные тесты вроде теста Манна - Кендалла, Аббе - Линника, Фостера - Стюарта, автокорреляции (н-р, в форме Дюфора - Роя), которые с тех пор представляют разве что исторический интерес.

В этом смысле на два порядка разумнее воспользоваться тестом Филиппса - Перрона (PP.test{stats}), но уж никак не Фостером - Стюартом.
При этом отдавая себе отчет в том, что все эти тесты даже на смоделированных данных обладают околонулевой мощностью.
  Форум: Медицинская статистика · Просмотр сообщения: #23609 · Ответов: 21 · Просмотров: 4895

28 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена