Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

6 страниц V   1 2 3 > » 

kont
Отправлено: 6.11.2017 - 20:25


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


> g=as.data.frame(df.sales.t[1:10])
> g
df.sales.t[1:10]
1 108
2 0
3 0
4 108
5 0
6 216
7 0
8 0
9 0
10 0
>

я получил 10 пер

или без запятой t[,1
> g=as.data.frame(df.sales.t[1,1:10])
Error in df.sales.t[1, 1:10] : incorrect number of dimensions
>
  Форум: Медицинская статистика · Просмотр сообщения: #22139 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 6.11.2017 - 16:45


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


p2004r, можно Вас последний раз потревожить? С остальными ошибками сам разобрался.
А суть вывода данных.
пример, см. скрин
df.sales.t <- acast(mydat, DAY ~ ART ~ STORE , value.var="SALES", fill=0)
View(df.sales.t )
у нас обычный датафрем по строкам даты, по столбцам


ок, хочу записать этот датафрейм в csv
g=as.data.frame(df.sales.t[,1,1:10])
Как результат совершенно не те столбцы
Код
> g
            956  958   961  974 980  999  1053 1082 1094 1122
01.ноя.15 108.0  0.0   0.0  0.0   0  0.0 216.0  0.0    0    0
02.ноя.15   0.0  0.0  97.0  0.0   0  0.0   0.0  0.0    0    0
03.ноя.15   0.0  0.0  97.0 99.9   0  0.0   0.0  0.0  106    0
04.ноя.15 108.0  0.0  97.0  0.0   0  0.0 108.0  0.0    0    0
05.ноя.15   0.0  0.0   0.0 99.9   0  0.0   0.0  0.0    0    0
06.ноя.15 216.0  0.0  97.0  0.0 106  0.0   0.0  0.0    0    0
07.ноя.15   0.0  0.0   0.0  0.0 106  0.0   0.0  0.0  212    0
08.ноя.15   0.0 99.9  97.0  0.0   0  0.0 108.0  0.0  212   86
09.ноя.15   0.0  0.0 194.0  0.0   0  0.0 108.0  0.0    0    0
10.ноя.15   0.0  0.0   0.0  0.0 106 99.9   0.0  0.0    0    0
11.ноя.15   0.0  0.0   0.0  0.0   0  0.0   0.0  0.0    0    0
12.ноя.15   0.0  0.0   0.0 99.9   0  0.0   0.0  0.0  212    0
13.ноя.15   0.0  0.0   0.0  0.0   0  0.0   0.0  0.0    0    0
14.ноя.15 108.0  0.0  97.0  0.0   0 99.9   0.0 89.9  106    0
15.ноя.15   0.0  0.0   0.0  0.0   0  0.0  99.9  0.0   98    0
16.ноя.15   0.0  0.0   0.0  0.0   0  0.0   0.0  0.0  294    0
17.ноя.15 199.8  0.0  97.0  0.0   0  0.0   0.0  0.0   98    0
18.ноя.15   0.0  0.0   0.0 89.9  92  0.0   0.0  0.0  196    0
19.ноя.15   0.0  0.0   0.0  0.0  92  0.0   0.0 89.9   98    0
20.ноя.15   0.0  0.0   0.0  0.0   0  0.0  99.9  0.0   98    0
21.ноя.15   0.0 99.9   0.0  0.0   0  0.0  99.9  0.0   98    0
22.ноя.15   0.0  0.0   0.0 89.9   0  0.0   0.0  0.0    0    0
23.ноя.15  92.0  0.0   0.0 89.9   0 89.9   0.0 88.0    0    0
24.ноя.15   0.0  0.0   0.0  0.0   0  0.0   0.0  0.0    0   86
25.ноя.15   0.0  0.0   0.0 89.9   0  0.0  92.0  0.0    0  172
26.ноя.15   0.0  0.0   0.0  0.0   0  0.0   0.0  0.0   92   86
27.ноя.15   0.0  0.0   0.0  0.0   0  0.0   0.0  0.0   92    0
28.ноя.15   0.0 89.9   0.0  0.0   0  0.0  92.0  0.0    0    0
29.ноя.15 184.0  0.0  89.9 89.9  86  0.0   0.0  0.0    0    0

как мне в датафрейм перевести весь df.sales.t
чтобы отображались все 7000 столбцов

всё больше мне ничего не надо:)

help.gif, пожалуйста.
  Форум: Медицинская статистика · Просмотр сообщения: #22137 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 3.11.2017 - 15:34


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


сможете помочь по этой ошибке?
  Форум: Медицинская статистика · Просмотр сообщения: #22112 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 3.11.2017 - 11:59


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005




стал писать цикл для анализа, сможете помочь, разобраться, пожалуйста.
выдал ошибкуmy_forecast <- function(x){
model <- arima(x, order = c(1, 1, 1))
fcast <- forecast(model, 1)
return(fcast)
}

prog=lapply(df.sales.t[1:1], my_forecast)



Error in arima(x, order = c(1, 1, 1)) : too few non-missing observations
  Форум: Медицинская статистика · Просмотр сообщения: #22111 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 3.11.2017 - 01:00


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


Нет, это обычные продовольственные товары, как вы сказали, макароны, куры.. до хоть джек дениелс и кола))

Я ратую за модель ARIMA ... обосновываю это тем, что аддитивные модели больше для прогнозов по месячным данным. Да и на стаковерфлоу, люди тоже советуют АРИМУ.
вернее stats.stackexchange.com/
https://stats.stackexchange.com/questions/1...series-analysis
  Форум: Медицинская статистика · Просмотр сообщения: #22110 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 2.11.2017 - 22:20


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


Я Вас правильно понял, теперь уже можно делать форекаст на сплитованном датасете df.sales.t?

# проверки на стационарность
adf.test(df.sales.t, alternative = "stationary")

#forecast
auto.arima(df.sales.t, seasonal=FALSE)
fit2 = arima(df.sales.t, order=c(1,1,7))

#
fcast <- forecast(fit2, h=1) # 1day ahead
  Форум: Медицинская статистика · Просмотр сообщения: #22107 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 2.11.2017 - 15:50


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


Зато я понял, что значит утро вечера мудренее, я услышал, то о чем говорил p2004r. Действительно под вечер глядя ничего не соображал, а Вы правы, я лепил все в одну кучу, мне же нужно сделать форекаст для каждого магазина и каждого артикулла. Я пошел не тензорным путем, он для меня сложен пока, я пошел по старинке

datas=read.csv(sales.csv", sep=";",dec=",")
View(datas)
str(datas)


count_ts = ts(datas[, c('SALES')])
View(count_ts)

datas$clean_cnt = tsclean(count_ts)



datas$cnt_ma = ma(datas$clean_cnt, order=7) # using the clean count with no outliers
datas$cnt_ma30 = ma(datas$clean_cnt, order=30)

count_ma = ts(na.omit(datas$cnt_ma), frequency=30)
decomp = stl(count_ma, s.window="periodic")
deseasonal_cnt <- seasadj(decomp)
plot(decomp)


adf.test(count_ma, alternative = "stationary") # ряд стационарный , тест Дюке-Фудллера (p<0.01)

#count_d1 = diff(deseasonal_cnt, differences = 1)

#adf.test(count_d1, alternative = "stationary") # p<0,05 is STACIONARY SERIES


auto.arima(deseasonal_cnt, seasonal=FALSE)


fit<-auto.arima(deseasonal_cnt, seasonal=FALSE)

tsdisplay(residuals(fit), lag.max=45, main='(1,1,0) Model Residuals')



fit2 = arima(deseasonal_cnt, order=c(1,1,7))


fcast <- forecast(fit2, h=30)

p2004r,теперь когда на меня нашло озорение, сможете подсказать как мне сплит по группам сделать (shop+art)
  Форум: Медицинская статистика · Просмотр сообщения: #22100 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 1.11.2017 - 22:52


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


p2004r прогнозируются общие суммы продаж купили макароны, и куры в итоге общая выручка 200 рублей. все её и нужно спрогнозировать, но я не могу понять как прогнозировать по ежедневным данным
сможете помочь?

PS
Вы сюда точно "на охоту ходите"ТМ?
что значит эта фраза?
  Форум: Медицинская статистика · Просмотр сообщения: #22097 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 1.11.2017 - 22:37


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


переменная
mydatas=read.csv2(sales.csv)
test=ts(mydatas$SALES,frequency=365, start=c(2015, 11))
  Форум: Медицинская статистика · Просмотр сообщения: #22095 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 1.11.2017 - 22:36


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


хотя Хольт-Винтерс для ежедневных данных, что-то я погорячился
fit <- auto.arima(datas$SALES)
но тоже не спасло фигня какая-то выходит))
  Форум: Медицинская статистика · Просмотр сообщения: #22094 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 1.11.2017 - 22:23


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


p2004r. я воспроизвел, а предикативную модель -ку то как строить?
именно вот эту часть
testforecast=HoltWinters(test,beta=F,gamma=F)

по идеи после этого стринга
testforecast$fitted
я должен видеть нормальное предсказание)) а не то что я увидел)

  Форум: Медицинская статистика · Просмотр сообщения: #22092 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 1.11.2017 - 21:23


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


я стараюсь)
help.gif
на стаковерфлоу загуглил starting a daily time series in R

test=ts(mydat$SALES,frequency=365, start=c(2015, 11))

#Хольт-Винтерс
testforecast=HoltWinters(test,beta=F,gamma=F)


testforecast$fitted

я получаю фигню какую-то
2015.090 63.66014 63.66014
2015.093 63.69003 63.69003
2015.096 63.67381 63.67381
2015.099 63.69335 63.69335
2015.101 63.74642 63.74642
2015.104 63.75224 63.75224
2015.107 63.75847 63.75847
2015.110 63.75986 63.75986
2015.112 63.76634 63.76634
2015.115 63.81441 63.81441
2015.118 63.79887 63.79887
2015.121 63.78152 63.78152
2015.123 63.81786 63.81786
2015.126 63.88588 63.88588
2015.129 63.87830 63.87830
2015.132 63.86346 63.86346
2015.134 63.86787 63.86787
2015.137 63.86864 63.86864
2015.140 63.85490 63.85490

покажите, пожалуйста, как правильно нужно sorry.gif sad.gif help.gif
мне самому сложно
  Форум: Медицинская статистика · Просмотр сообщения: #22090 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 1.11.2017 - 20:49


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


'data.frame': 873912 obs. of 4 variables:
$ DAY : Factor w/ 30 levels "01.11.2015","02.11.2015",..: 1 1 1 1 1 1 1 1 1 1 ...
$ STORE: int 1534 25039 1612 1053 1612 961 1602 21761 19009 22691 ...
$ ART : int 343533 20490 295206 16406274 49495 15309949 242763 188087 16350692 86093 ...
$ SALES: num 62.5 686.4 185 32.5 143.1 ...

day-день продажи
STORE код магизина
ART код товара
SALES: цена

даны данные по дням за месяц
нужно предсказать значения за 30.11.2015

вот я и думаю что мне указать во фриквенси
и что указать в параметре h
  Форум: Медицинская статистика · Просмотр сообщения: #22088 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 1.11.2017 - 20:38


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


p2004r, я немного изменил свой вопрос
предсказываем переменную SALES это сумма покупок
вопрос в том, что если мне нужно предсказать на один день вперед , какое значение нужно указать во frequency

далее
library("forecast")
testforecast2=forecast.HoltWinters(testforecast,h=?)
h это параметр который указывает насколько вперед предсказываем
мне так и ставить единицу? т.е. 30-11.2015
  Форум: Медицинская статистика · Просмотр сообщения: #22086 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 1.11.2017 - 16:41


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


Подскажите, мне нужно построить предсказание по дням
test=ts(datas$SALES,start=c(01-11-2015))
test



Предсказание я делаю на базе продаж за месяц на день вперед , т.е. зная данные за месяц предсказать объем продаж на 30.11.2015

На всякий случай прикреплю данные

переформулирую свой вопрос
Usage

ts(data = NA, start = 1, end = numeric(), frequency = 1,
deltat = 1, ts.eps = getOption("ts.eps"), class = , names = )

если я прогнозирую на один день, что мне указать во фреквенси?
Прикрепленные файлы
Прикрепленный файл  sales.zip ( 5,94 мегабайт ) Кол-во скачиваний: 5
 
  Форум: Медицинская статистика · Просмотр сообщения: #22084 · Ответов: 26 · Просмотров: 1500

kont
Отправлено: 29.09.2017 - 16:20


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


Спасибо, теперь ясно
  Форум: Медицинская статистика · Просмотр сообщения: #21934 · Ответов: 2 · Просмотров: 322

kont
Отправлено: 28.09.2017 - 17:00


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


Подскажите, пожалуйста, как правильно интерпретировать значение VIF в Spss?
что значит эти значения
9,446
1,704

А также
Variance Proportions
что значит в третьем измерении у переменной x6 значение 0.81?

Прикрепленные файлы
Прикрепленный файл  Лист_Microsoft_Excel__2_.zip ( 9,78 килобайт ) Кол-во скачиваний: 11
 
  Форум: Медицинская статистика · Просмотр сообщения: #21927 · Ответов: 2 · Просмотров: 322

kont
Отправлено: 3.09.2017 - 17:17


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


Я использовал тот, что реализован в Statistica 10
как узнать какая именно это нелинейная регрессия регрессия?
Сами данные тут
год независимая переменная
Эскизы прикрепленных изображений
Прикрепленное изображение
 

Прикрепленные файлы
Прикрепленный файл  con1.zip ( 5,9 килобайт ) Кол-во скачиваний: 12
 
  Форум: Медицинская статистика · Просмотр сообщения: #21882 · Ответов: 4 · Просмотров: 1036

kont
Отправлено: 1.09.2017 - 11:56


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


Из-за годичного представления информации, я решил лучше сделать нелинейную регрессию)
  Форум: Медицинская статистика · Просмотр сообщения: #21870 · Ответов: 4 · Просмотров: 1036

kont
Отправлено: 29.08.2017 - 00:10


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


Снова Анализ временных рядов). Подскажите, пожалуйста, какая модель годится для предсказание не по месяцам, тут то понятно Мультипликативная Винтерса, а по годам в таком формате


2006
2007
...
2017
т.е. 11 наблюдений

мне нужно сделать прогноз на 10 лет вперед до 2027 года. Какую модель Анализа временных рядов, лучше применить?
  Форум: Медицинская статистика · Просмотр сообщения: #21854 · Ответов: 4 · Просмотров: 1036

kont
Отправлено: 22.08.2017 - 16:07


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


в сторону какой библиотечки лучше смотреть? Карет не устраивает.
  Форум: Медицинская статистика · Просмотр сообщения: #21838 · Ответов: 7 · Просмотров: 1306

kont
Отправлено: 19.08.2017 - 20:26


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


скорее модели много слойного перцептрона, 4 наилучших
входные нейроные-скрытые и выходные
точность хреновая, как видите
  Форум: Медицинская статистика · Просмотр сообщения: #21830 · Ответов: 7 · Просмотров: 1306

kont
Отправлено: 18.08.2017 - 18:47


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


p2004r, вопрос к Вам, как к активному пользователю, в каких случаях мы наблюдаем такое, тут ни одна из предложенных MLP не сработало правильно? Чтобы это значило, и как исправить?
Эскизы прикрепленных изображений
Прикрепленное изображение
 

Прикрепленные файлы
Прикрепленный файл  mlp.zip ( 254,78 килобайт ) Кол-во скачиваний: 15
 
  Форум: Медицинская статистика · Просмотр сообщения: #21828 · Ответов: 7 · Просмотров: 1306

kont
Отправлено: 18.08.2017 - 17:20


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


да там, понятно написано
  Форум: Медицинская статистика · Просмотр сообщения: #21827 · Ответов: 7 · Просмотров: 1306

kont
Отправлено: 18.08.2017 - 17:14


Дух форума
*

Группа: Пользователи
Сообщений: 144
Регистрация: 11.02.2014
Пользователь №: 26005


любая дополнительная информация ценная всегда, даже запоздалая))
  Форум: Медицинская статистика · Просмотр сообщения: #21826 · Ответов: 23 · Просмотров: 3055

6 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена