Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

6 страниц V   1 2 3 > » 

kont
Отправлено: 1.12.2018 - 14:08





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Подскажите, вот провел я множественную регрессию. Смотрю остатки. У меня возник, а какие остатки приемлемые, а какие нет.
Например исходное значение 24, предсказано 23, остаток=1. Нормально ли это? Т.е. вопрос какое максимальное расхождение считается допустимо, чтобы сказать, это модель крута?(с учетом того, что остаток в ноль, не такое частое явление, увы)
  Форум: Медицинская статистика · Просмотр сообщения: #23555 · Ответов: 3 · Просмотров: 4685

kont
Отправлено: 5.04.2018 - 15:18





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Подскажите, пожалуйста. Я провел факторный анализ и сохранил нагрузки факторов в регрессионные оценки (в spss).
получил 3 переменных
fac1,fac2,fac3
хочу их сравнить по полу (t-test independed)

Код
fac1(желание выпить)
м    0,995
м    -3,5
м    -0,4
м    -2,34
ж    0,9
ж    -0,04
ж    2
ж    2,46543
ж    -0,009


среднее у мужчин по фактору -1,31
у женщин 1,06

Вопрос в знаках, у кого больше выражен фактор у мужчин или у женщин(мы по модулю смотрим или знак учитывается, т.е. чем меньше значение нуля тем менее выражен фактор и наоборот чем больше значения тем больше фактор выражен)?
  Форум: Медицинская статистика · Просмотр сообщения: #22867 · Ответов: 1 · Просмотров: 3438

kont
Отправлено: 9.03.2018 - 15:38





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Добрый день. Суть задачи
Есть сервис. В этом сервисе много клиентов, но стабильный доход приносит всего 1500 клиентов
(что за сервис, абсолютно не важно)
Сервис хочет сменить оплату за услуги с одной валюты на другую. Раньше платили долларами, а сейчас надо евро. (ну так удобно аффторам сервиса)
Естественно непонятно как люди на это отреагируют. Есть опасения, что если перевести на евровую оплату, то это меньшинство, которое платит деньги может обидеться и перестать пользоваться сервисом pardon.gif
Необходимо провести тесты чтобы просмотреть реакцию клиентов на смену. В нашем случае генеральная совокупность всего 1500 человек. Надо взять какую то самую минимальную выборку и посмотреть как изменить пользовательское поведение, как по метрическим параметрам
(время сессии на сайте, количество заказов,количество трат, покупок.......), так и категориальные (перестал пользоваться, продолжил)
Метрические переменные. Т.е. две выборки (одна пользуется старой оплатой, другой сказали плати еврами).
Т.о мы можем сравнивать выборки как независимые по нашим параметрам t-test или манна-Уитни
Можем как зависимые. до-после на евровой выборк t-test dep, Вилкоксон
категориальные тут МакНимара нужно использовать только на евровой выборке
Как сделать так, чтобы выборка была минимально возможной с одной стороны, т.е. кол-во крайне мало, и при этом максимально точно описывала результат.
  Форум: Медицинская статистика · Просмотр сообщения: #22750 · Ответов: 2 · Просмотров: 4587

kont
Отправлено: 10.01.2018 - 18:52





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


leo_biostat, и Вам доброго дня.
Не одними бинарными переменными откликами статистика сыта:)
во-первых переменная отклика может иметь намного больше градаций и задача скорее классификационная, где Дискриминантный анализ не помощник из-за большого числа разрозненный данных и их большого количества.
Что в таком случае делать нужно?))
  Форум: Медицинская статистика · Просмотр сообщения: #22406 · Ответов: 3 · Просмотров: 4743

kont
Отправлено: 10.01.2018 - 16:40





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Подскажите, теоретический вопрос.
Допустим я построил нейросетевую модель. Переменная отклика -бинарная (1,0)
Но модель плохого качества
плохой AUC
переобучение на лицо. и прочее плохие бяки:)

Что мне нужно сделать, чтобы понять почему всё так плохо
и какие попытки нужно предпринять , чтобы улучшить качество модели
Потому что одним изменением параметров таких как порог и кол-во скрытых слоев и нейронов в них явно не отделаешься.

  Форум: Медицинская статистика · Просмотр сообщения: #22404 · Ответов: 3 · Просмотров: 4743

kont
Отправлено: 6.11.2017 - 20:25





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


> g=as.data.frame(df.sales.t[1:10])
> g
df.sales.t[1:10]
1 108
2 0
3 0
4 108
5 0
6 216
7 0
8 0
9 0
10 0
>

я получил 10 пер

или без запятой t[,1
> g=as.data.frame(df.sales.t[1,1:10])
Error in df.sales.t[1, 1:10] : incorrect number of dimensions
>
  Форум: Медицинская статистика · Просмотр сообщения: #22139 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 6.11.2017 - 16:45





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


p2004r, можно Вас последний раз потревожить? С остальными ошибками сам разобрался.
А суть вывода данных.
пример, см. скрин
df.sales.t <- acast(mydat, DAY ~ ART ~ STORE , value.var="SALES", fill=0)
View(df.sales.t )
у нас обычный датафрем по строкам даты, по столбцам


ок, хочу записать этот датафрейм в csv
g=as.data.frame(df.sales.t[,1,1:10])
Как результат совершенно не те столбцы
Код
> g
            956  958   961  974 980  999  1053 1082 1094 1122
01.ноя.15 108.0  0.0   0.0  0.0   0  0.0 216.0  0.0    0    0
02.ноя.15   0.0  0.0  97.0  0.0   0  0.0   0.0  0.0    0    0
03.ноя.15   0.0  0.0  97.0 99.9   0  0.0   0.0  0.0  106    0
04.ноя.15 108.0  0.0  97.0  0.0   0  0.0 108.0  0.0    0    0
05.ноя.15   0.0  0.0   0.0 99.9   0  0.0   0.0  0.0    0    0
06.ноя.15 216.0  0.0  97.0  0.0 106  0.0   0.0  0.0    0    0
07.ноя.15   0.0  0.0   0.0  0.0 106  0.0   0.0  0.0  212    0
08.ноя.15   0.0 99.9  97.0  0.0   0  0.0 108.0  0.0  212   86
09.ноя.15   0.0  0.0 194.0  0.0   0  0.0 108.0  0.0    0    0
10.ноя.15   0.0  0.0   0.0  0.0 106 99.9   0.0  0.0    0    0
11.ноя.15   0.0  0.0   0.0  0.0   0  0.0   0.0  0.0    0    0
12.ноя.15   0.0  0.0   0.0 99.9   0  0.0   0.0  0.0  212    0
13.ноя.15   0.0  0.0   0.0  0.0   0  0.0   0.0  0.0    0    0
14.ноя.15 108.0  0.0  97.0  0.0   0 99.9   0.0 89.9  106    0
15.ноя.15   0.0  0.0   0.0  0.0   0  0.0  99.9  0.0   98    0
16.ноя.15   0.0  0.0   0.0  0.0   0  0.0   0.0  0.0  294    0
17.ноя.15 199.8  0.0  97.0  0.0   0  0.0   0.0  0.0   98    0
18.ноя.15   0.0  0.0   0.0 89.9  92  0.0   0.0  0.0  196    0
19.ноя.15   0.0  0.0   0.0  0.0  92  0.0   0.0 89.9   98    0
20.ноя.15   0.0  0.0   0.0  0.0   0  0.0  99.9  0.0   98    0
21.ноя.15   0.0 99.9   0.0  0.0   0  0.0  99.9  0.0   98    0
22.ноя.15   0.0  0.0   0.0 89.9   0  0.0   0.0  0.0    0    0
23.ноя.15  92.0  0.0   0.0 89.9   0 89.9   0.0 88.0    0    0
24.ноя.15   0.0  0.0   0.0  0.0   0  0.0   0.0  0.0    0   86
25.ноя.15   0.0  0.0   0.0 89.9   0  0.0  92.0  0.0    0  172
26.ноя.15   0.0  0.0   0.0  0.0   0  0.0   0.0  0.0   92   86
27.ноя.15   0.0  0.0   0.0  0.0   0  0.0   0.0  0.0   92    0
28.ноя.15   0.0 89.9   0.0  0.0   0  0.0  92.0  0.0    0    0
29.ноя.15 184.0  0.0  89.9 89.9  86  0.0   0.0  0.0    0    0

как мне в датафрейм перевести весь df.sales.t
чтобы отображались все 7000 столбцов

всё больше мне ничего не надо:)

help.gif, пожалуйста.
  Форум: Медицинская статистика · Просмотр сообщения: #22137 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 3.11.2017 - 15:34





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


сможете помочь по этой ошибке?
  Форум: Медицинская статистика · Просмотр сообщения: #22112 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 3.11.2017 - 11:59





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005




стал писать цикл для анализа, сможете помочь, разобраться, пожалуйста.
выдал ошибкуmy_forecast <- function(x){
model <- arima(x, order = c(1, 1, 1))
fcast <- forecast(model, 1)
return(fcast)
}

prog=lapply(df.sales.t[1:1], my_forecast)



Error in arima(x, order = c(1, 1, 1)) : too few non-missing observations
  Форум: Медицинская статистика · Просмотр сообщения: #22111 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 3.11.2017 - 01:00





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Нет, это обычные продовольственные товары, как вы сказали, макароны, куры.. до хоть джек дениелс и кола))

Я ратую за модель ARIMA ... обосновываю это тем, что аддитивные модели больше для прогнозов по месячным данным. Да и на стаковерфлоу, люди тоже советуют АРИМУ.
вернее stats.stackexchange.com/
https://stats.stackexchange.com/questions/1...series-analysis
  Форум: Медицинская статистика · Просмотр сообщения: #22110 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 2.11.2017 - 22:20





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Я Вас правильно понял, теперь уже можно делать форекаст на сплитованном датасете df.sales.t?

# проверки на стационарность
adf.test(df.sales.t, alternative = "stationary")

#forecast
auto.arima(df.sales.t, seasonal=FALSE)
fit2 = arima(df.sales.t, order=c(1,1,7))

#
fcast <- forecast(fit2, h=1) # 1day ahead
  Форум: Медицинская статистика · Просмотр сообщения: #22107 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 2.11.2017 - 15:50





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Зато я понял, что значит утро вечера мудренее, я услышал, то о чем говорил p2004r. Действительно под вечер глядя ничего не соображал, а Вы правы, я лепил все в одну кучу, мне же нужно сделать форекаст для каждого магазина и каждого артикулла. Я пошел не тензорным путем, он для меня сложен пока, я пошел по старинке

datas=read.csv(sales.csv", sep=";",dec=",")
View(datas)
str(datas)


count_ts = ts(datas[, c('SALES')])
View(count_ts)

datas$clean_cnt = tsclean(count_ts)



datas$cnt_ma = ma(datas$clean_cnt, order=7) # using the clean count with no outliers
datas$cnt_ma30 = ma(datas$clean_cnt, order=30)

count_ma = ts(na.omit(datas$cnt_ma), frequency=30)
decomp = stl(count_ma, s.window="periodic")
deseasonal_cnt <- seasadj(decomp)
plot(decomp)


adf.test(count_ma, alternative = "stationary") # ряд стационарный , тест Дюке-Фудллера (p<0.01)

#count_d1 = diff(deseasonal_cnt, differences = 1)

#adf.test(count_d1, alternative = "stationary") # p<0,05 is STACIONARY SERIES


auto.arima(deseasonal_cnt, seasonal=FALSE)


fit<-auto.arima(deseasonal_cnt, seasonal=FALSE)

tsdisplay(residuals(fit), lag.max=45, main='(1,1,0) Model Residuals')



fit2 = arima(deseasonal_cnt, order=c(1,1,7))


fcast <- forecast(fit2, h=30)

p2004r,теперь когда на меня нашло озорение, сможете подсказать как мне сплит по группам сделать (shop+art)
  Форум: Медицинская статистика · Просмотр сообщения: #22100 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 1.11.2017 - 22:52





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


p2004r прогнозируются общие суммы продаж купили макароны, и куры в итоге общая выручка 200 рублей. все её и нужно спрогнозировать, но я не могу понять как прогнозировать по ежедневным данным
сможете помочь?

PS
Вы сюда точно "на охоту ходите"ТМ?
что значит эта фраза?
  Форум: Медицинская статистика · Просмотр сообщения: #22097 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 1.11.2017 - 22:37





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


переменная
mydatas=read.csv2(sales.csv)
test=ts(mydatas$SALES,frequency=365, start=c(2015, 11))
  Форум: Медицинская статистика · Просмотр сообщения: #22095 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 1.11.2017 - 22:36





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


хотя Хольт-Винтерс для ежедневных данных, что-то я погорячился
fit <- auto.arima(datas$SALES)
но тоже не спасло фигня какая-то выходит))
  Форум: Медицинская статистика · Просмотр сообщения: #22094 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 1.11.2017 - 22:23





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


p2004r. я воспроизвел, а предикативную модель -ку то как строить?
именно вот эту часть
testforecast=HoltWinters(test,beta=F,gamma=F)

по идеи после этого стринга
testforecast$fitted
я должен видеть нормальное предсказание)) а не то что я увидел)

  Форум: Медицинская статистика · Просмотр сообщения: #22092 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 1.11.2017 - 21:23





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


я стараюсь)
help.gif
на стаковерфлоу загуглил starting a daily time series in R

test=ts(mydat$SALES,frequency=365, start=c(2015, 11))

#Хольт-Винтерс
testforecast=HoltWinters(test,beta=F,gamma=F)


testforecast$fitted

я получаю фигню какую-то
2015.090 63.66014 63.66014
2015.093 63.69003 63.69003
2015.096 63.67381 63.67381
2015.099 63.69335 63.69335
2015.101 63.74642 63.74642
2015.104 63.75224 63.75224
2015.107 63.75847 63.75847
2015.110 63.75986 63.75986
2015.112 63.76634 63.76634
2015.115 63.81441 63.81441
2015.118 63.79887 63.79887
2015.121 63.78152 63.78152
2015.123 63.81786 63.81786
2015.126 63.88588 63.88588
2015.129 63.87830 63.87830
2015.132 63.86346 63.86346
2015.134 63.86787 63.86787
2015.137 63.86864 63.86864
2015.140 63.85490 63.85490

покажите, пожалуйста, как правильно нужно sorry.gif sad.gif help.gif
мне самому сложно
  Форум: Медицинская статистика · Просмотр сообщения: #22090 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 1.11.2017 - 20:49





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


'data.frame': 873912 obs. of 4 variables:
$ DAY : Factor w/ 30 levels "01.11.2015","02.11.2015",..: 1 1 1 1 1 1 1 1 1 1 ...
$ STORE: int 1534 25039 1612 1053 1612 961 1602 21761 19009 22691 ...
$ ART : int 343533 20490 295206 16406274 49495 15309949 242763 188087 16350692 86093 ...
$ SALES: num 62.5 686.4 185 32.5 143.1 ...

day-день продажи
STORE код магизина
ART код товара
SALES: цена

даны данные по дням за месяц
нужно предсказать значения за 30.11.2015

вот я и думаю что мне указать во фриквенси
и что указать в параметре h
  Форум: Медицинская статистика · Просмотр сообщения: #22088 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 1.11.2017 - 20:38





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


p2004r, я немного изменил свой вопрос
предсказываем переменную SALES это сумма покупок
вопрос в том, что если мне нужно предсказать на один день вперед , какое значение нужно указать во frequency

далее
library("forecast")
testforecast2=forecast.HoltWinters(testforecast,h=?)
h это параметр который указывает насколько вперед предсказываем
мне так и ставить единицу? т.е. 30-11.2015
  Форум: Медицинская статистика · Просмотр сообщения: #22086 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 1.11.2017 - 16:41





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Подскажите, мне нужно построить предсказание по дням
test=ts(datas$SALES,start=c(01-11-2015))
test



Предсказание я делаю на базе продаж за месяц на день вперед , т.е. зная данные за месяц предсказать объем продаж на 30.11.2015

На всякий случай прикреплю данные

переформулирую свой вопрос
Usage

ts(data = NA, start = 1, end = numeric(), frequency = 1,
deltat = 1, ts.eps = getOption("ts.eps"), class = , names = )

если я прогнозирую на один день, что мне указать во фреквенси?
Прикрепленные файлы
Прикрепленный файл  sales.zip ( 5,94 мегабайт ) Кол-во скачиваний: 319
 
  Форум: Медицинская статистика · Просмотр сообщения: #22084 · Ответов: 26 · Просмотров: 24810

kont
Отправлено: 29.09.2017 - 16:20





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Спасибо, теперь ясно
  Форум: Медицинская статистика · Просмотр сообщения: #21934 · Ответов: 2 · Просмотров: 4274

kont
Отправлено: 28.09.2017 - 17:00





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Подскажите, пожалуйста, как правильно интерпретировать значение VIF в Spss?
что значит эти значения
9,446
1,704

А также
Variance Proportions
что значит в третьем измерении у переменной x6 значение 0.81?

Прикрепленные файлы
Прикрепленный файл  Лист_Microsoft_Excel__2_.zip ( 9,78 килобайт ) Кол-во скачиваний: 306
 
  Форум: Медицинская статистика · Просмотр сообщения: #21927 · Ответов: 2 · Просмотров: 4274

kont
Отправлено: 3.09.2017 - 17:17





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Я использовал тот, что реализован в Statistica 10
как узнать какая именно это нелинейная регрессия регрессия?
Сами данные тут
год независимая переменная
Эскизы прикрепленных изображений
Прикрепленное изображение
 

Прикрепленные файлы
Прикрепленный файл  con1.zip ( 5,9 килобайт ) Кол-во скачиваний: 288
 
  Форум: Медицинская статистика · Просмотр сообщения: #21882 · Ответов: 4 · Просмотров: 6846

kont
Отправлено: 1.09.2017 - 11:56





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Из-за годичного представления информации, я решил лучше сделать нелинейную регрессию)
  Форум: Медицинская статистика · Просмотр сообщения: #21870 · Ответов: 4 · Просмотров: 6846

kont
Отправлено: 29.08.2017 - 00:10





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005


Снова Анализ временных рядов). Подскажите, пожалуйста, какая модель годится для предсказание не по месяцам, тут то понятно Мультипликативная Винтерса, а по годам в таком формате


2006
2007
...
2017
т.е. 11 наблюдений

мне нужно сделать прогноз на 10 лет вперед до 2027 года. Какую модель Анализа временных рядов, лучше применить?
  Форум: Медицинская статистика · Просмотр сообщения: #21854 · Ответов: 4 · Просмотров: 6846

6 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена