Здравствуйте, гость ( Вход | Регистрация )
Отправлено: 1.12.2018 - 14:08 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Подскажите, вот провел я множественную регрессию. Смотрю остатки. У меня возник, а какие остатки приемлемые, а какие нет. Например исходное значение 24, предсказано 23, остаток=1. Нормально ли это? Т.е. вопрос какое максимальное расхождение считается допустимо, чтобы сказать, это модель крута?(с учетом того, что остаток в ноль, не такое частое явление, увы) |
Форум: Медицинская статистика · Просмотр сообщения: #23555 · Ответов: 3 · Просмотров: 4924 |
Отправлено: 5.04.2018 - 15:18 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Подскажите, пожалуйста. Я провел факторный анализ и сохранил нагрузки факторов в регрессионные оценки (в spss). получил 3 переменных fac1,fac2,fac3 хочу их сравнить по полу (t-test independed) Код fac1(желание выпить) м 0,995 м -3,5 м -0,4 м -2,34 ж 0,9 ж -0,04 ж 2 ж 2,46543 ж -0,009 среднее у мужчин по фактору -1,31 у женщин 1,06 Вопрос в знаках, у кого больше выражен фактор у мужчин или у женщин(мы по модулю смотрим или знак учитывается, т.е. чем меньше значение нуля тем менее выражен фактор и наоборот чем больше значения тем больше фактор выражен)? |
Форум: Медицинская статистика · Просмотр сообщения: #22867 · Ответов: 1 · Просмотров: 3662 |
Отправлено: 9.03.2018 - 15:38 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Добрый день. Суть задачи Есть сервис. В этом сервисе много клиентов, но стабильный доход приносит всего 1500 клиентов (что за сервис, абсолютно не важно) Сервис хочет сменить оплату за услуги с одной валюты на другую. Раньше платили долларами, а сейчас надо евро. (ну так удобно аффторам сервиса) Естественно непонятно как люди на это отреагируют. Есть опасения, что если перевести на евровую оплату, то это меньшинство, которое платит деньги может обидеться и перестать пользоваться сервисом Необходимо провести тесты чтобы просмотреть реакцию клиентов на смену. В нашем случае генеральная совокупность всего 1500 человек. Надо взять какую то самую минимальную выборку и посмотреть как изменить пользовательское поведение, как по метрическим параметрам (время сессии на сайте, количество заказов,количество трат, покупок.......), так и категориальные (перестал пользоваться, продолжил) Метрические переменные. Т.е. две выборки (одна пользуется старой оплатой, другой сказали плати еврами). Т.о мы можем сравнивать выборки как независимые по нашим параметрам t-test или манна-Уитни Можем как зависимые. до-после на евровой выборк t-test dep, Вилкоксон категориальные тут МакНимара нужно использовать только на евровой выборке Как сделать так, чтобы выборка была минимально возможной с одной стороны, т.е. кол-во крайне мало, и при этом максимально точно описывала результат. |
Форум: Медицинская статистика · Просмотр сообщения: #22750 · Ответов: 2 · Просмотров: 4795 |
Отправлено: 10.01.2018 - 18:52 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
leo_biostat, и Вам доброго дня. Не одними бинарными переменными откликами статистика сыта:) во-первых переменная отклика может иметь намного больше градаций и задача скорее классификационная, где Дискриминантный анализ не помощник из-за большого числа разрозненный данных и их большого количества. Что в таком случае делать нужно?)) |
Форум: Медицинская статистика · Просмотр сообщения: #22406 · Ответов: 3 · Просмотров: 5056 |
Отправлено: 10.01.2018 - 16:40 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Подскажите, теоретический вопрос. Допустим я построил нейросетевую модель. Переменная отклика -бинарная (1,0) Но модель плохого качества плохой AUC переобучение на лицо. и прочее плохие бяки:) Что мне нужно сделать, чтобы понять почему всё так плохо и какие попытки нужно предпринять , чтобы улучшить качество модели Потому что одним изменением параметров таких как порог и кол-во скрытых слоев и нейронов в них явно не отделаешься. |
Форум: Медицинская статистика · Просмотр сообщения: #22404 · Ответов: 3 · Просмотров: 5056 |
Отправлено: 6.11.2017 - 20:25 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
> g=as.data.frame(df.sales.t[1:10]) > g df.sales.t[1:10] 1 108 2 0 3 0 4 108 5 0 6 216 7 0 8 0 9 0 10 0 > я получил 10 пер или без запятой t[,1 > g=as.data.frame(df.sales.t[1,1:10]) Error in df.sales.t[1, 1:10] : incorrect number of dimensions > |
Форум: Медицинская статистика · Просмотр сообщения: #22139 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 6.11.2017 - 16:45 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
p2004r, можно Вас последний раз потревожить? С остальными ошибками сам разобрался. А суть вывода данных. пример, см. скрин df.sales.t <- acast(mydat, DAY ~ ART ~ STORE , value.var="SALES", fill=0) View(df.sales.t ) у нас обычный датафрем по строкам даты, по столбцам ок, хочу записать этот датафрейм в csv g=as.data.frame(df.sales.t[,1,1:10]) Как результат совершенно не те столбцы Код > g 956 958 961 974 980 999 1053 1082 1094 1122 01.ноя.15 108.0 0.0 0.0 0.0 0 0.0 216.0 0.0 0 0 02.ноя.15 0.0 0.0 97.0 0.0 0 0.0 0.0 0.0 0 0 03.ноя.15 0.0 0.0 97.0 99.9 0 0.0 0.0 0.0 106 0 04.ноя.15 108.0 0.0 97.0 0.0 0 0.0 108.0 0.0 0 0 05.ноя.15 0.0 0.0 0.0 99.9 0 0.0 0.0 0.0 0 0 06.ноя.15 216.0 0.0 97.0 0.0 106 0.0 0.0 0.0 0 0 07.ноя.15 0.0 0.0 0.0 0.0 106 0.0 0.0 0.0 212 0 08.ноя.15 0.0 99.9 97.0 0.0 0 0.0 108.0 0.0 212 86 09.ноя.15 0.0 0.0 194.0 0.0 0 0.0 108.0 0.0 0 0 10.ноя.15 0.0 0.0 0.0 0.0 106 99.9 0.0 0.0 0 0 11.ноя.15 0.0 0.0 0.0 0.0 0 0.0 0.0 0.0 0 0 12.ноя.15 0.0 0.0 0.0 99.9 0 0.0 0.0 0.0 212 0 13.ноя.15 0.0 0.0 0.0 0.0 0 0.0 0.0 0.0 0 0 14.ноя.15 108.0 0.0 97.0 0.0 0 99.9 0.0 89.9 106 0 15.ноя.15 0.0 0.0 0.0 0.0 0 0.0 99.9 0.0 98 0 16.ноя.15 0.0 0.0 0.0 0.0 0 0.0 0.0 0.0 294 0 17.ноя.15 199.8 0.0 97.0 0.0 0 0.0 0.0 0.0 98 0 18.ноя.15 0.0 0.0 0.0 89.9 92 0.0 0.0 0.0 196 0 19.ноя.15 0.0 0.0 0.0 0.0 92 0.0 0.0 89.9 98 0 20.ноя.15 0.0 0.0 0.0 0.0 0 0.0 99.9 0.0 98 0 21.ноя.15 0.0 99.9 0.0 0.0 0 0.0 99.9 0.0 98 0 22.ноя.15 0.0 0.0 0.0 89.9 0 0.0 0.0 0.0 0 0 23.ноя.15 92.0 0.0 0.0 89.9 0 89.9 0.0 88.0 0 0 24.ноя.15 0.0 0.0 0.0 0.0 0 0.0 0.0 0.0 0 86 25.ноя.15 0.0 0.0 0.0 89.9 0 0.0 92.0 0.0 0 172 26.ноя.15 0.0 0.0 0.0 0.0 0 0.0 0.0 0.0 92 86 27.ноя.15 0.0 0.0 0.0 0.0 0 0.0 0.0 0.0 92 0 28.ноя.15 0.0 89.9 0.0 0.0 0 0.0 92.0 0.0 0 0 29.ноя.15 184.0 0.0 89.9 89.9 86 0.0 0.0 0.0 0 0 как мне в датафрейм перевести весь df.sales.t чтобы отображались все 7000 столбцов всё больше мне ничего не надо:) , пожалуйста. |
Форум: Медицинская статистика · Просмотр сообщения: #22137 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 3.11.2017 - 15:34 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
сможете помочь по этой ошибке? |
Форум: Медицинская статистика · Просмотр сообщения: #22112 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 3.11.2017 - 11:59 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
стал писать цикл для анализа, сможете помочь, разобраться, пожалуйста. выдал ошибкуmy_forecast <- function(x){ model <- arima(x, order = c(1, 1, 1)) fcast <- forecast(model, 1) return(fcast) } prog=lapply(df.sales.t[1:1], my_forecast) Error in arima(x, order = c(1, 1, 1)) : too few non-missing observations |
Форум: Медицинская статистика · Просмотр сообщения: #22111 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 3.11.2017 - 01:00 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Нет, это обычные продовольственные товары, как вы сказали, макароны, куры.. до хоть джек дениелс и кола)) Я ратую за модель ARIMA ... обосновываю это тем, что аддитивные модели больше для прогнозов по месячным данным. Да и на стаковерфлоу, люди тоже советуют АРИМУ. вернее stats.stackexchange.com/ https://stats.stackexchange.com/questions/1...series-analysis |
Форум: Медицинская статистика · Просмотр сообщения: #22110 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 2.11.2017 - 22:20 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Я Вас правильно понял, теперь уже можно делать форекаст на сплитованном датасете df.sales.t? # проверки на стационарность adf.test(df.sales.t, alternative = "stationary") #forecast auto.arima(df.sales.t, seasonal=FALSE) fit2 = arima(df.sales.t, order=c(1,1,7)) # fcast <- forecast(fit2, h=1) # 1day ahead |
Форум: Медицинская статистика · Просмотр сообщения: #22107 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 2.11.2017 - 15:50 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Зато я понял, что значит утро вечера мудренее, я услышал, то о чем говорил p2004r. Действительно под вечер глядя ничего не соображал, а Вы правы, я лепил все в одну кучу, мне же нужно сделать форекаст для каждого магазина и каждого артикулла. Я пошел не тензорным путем, он для меня сложен пока, я пошел по старинке datas=read.csv(sales.csv", sep=";",dec=",") View(datas) str(datas) count_ts = ts(datas[, c('SALES')]) View(count_ts) datas$clean_cnt = tsclean(count_ts) datas$cnt_ma = ma(datas$clean_cnt, order=7) # using the clean count with no outliers datas$cnt_ma30 = ma(datas$clean_cnt, order=30) count_ma = ts(na.omit(datas$cnt_ma), frequency=30) decomp = stl(count_ma, s.window="periodic") deseasonal_cnt <- seasadj(decomp) plot(decomp) adf.test(count_ma, alternative = "stationary") # ряд стационарный , тест Дюке-Фудллера (p<0.01) #count_d1 = diff(deseasonal_cnt, differences = 1) #adf.test(count_d1, alternative = "stationary") # p<0,05 is STACIONARY SERIES auto.arima(deseasonal_cnt, seasonal=FALSE) fit<-auto.arima(deseasonal_cnt, seasonal=FALSE) tsdisplay(residuals(fit), lag.max=45, main='(1,1,0) Model Residuals') fit2 = arima(deseasonal_cnt, order=c(1,1,7)) fcast <- forecast(fit2, h=30) p2004r,теперь когда на меня нашло озорение, сможете подсказать как мне сплит по группам сделать (shop+art) |
Форум: Медицинская статистика · Просмотр сообщения: #22100 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 1.11.2017 - 22:52 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
p2004r прогнозируются общие суммы продаж купили макароны, и куры в итоге общая выручка 200 рублей. все её и нужно спрогнозировать, но я не могу понять как прогнозировать по ежедневным данным сможете помочь? PS Вы сюда точно "на охоту ходите"ТМ? что значит эта фраза? |
Форум: Медицинская статистика · Просмотр сообщения: #22097 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 1.11.2017 - 22:37 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
переменная mydatas=read.csv2(sales.csv) test=ts(mydatas$SALES,frequency=365, start=c(2015, 11)) |
Форум: Медицинская статистика · Просмотр сообщения: #22095 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 1.11.2017 - 22:36 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
хотя Хольт-Винтерс для ежедневных данных, что-то я погорячился fit <- auto.arima(datas$SALES) но тоже не спасло фигня какая-то выходит)) |
Форум: Медицинская статистика · Просмотр сообщения: #22094 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 1.11.2017 - 22:23 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
p2004r. я воспроизвел, а предикативную модель -ку то как строить? именно вот эту часть testforecast=HoltWinters(test,beta=F,gamma=F) по идеи после этого стринга testforecast$fitted я должен видеть нормальное предсказание)) а не то что я увидел) |
Форум: Медицинская статистика · Просмотр сообщения: #22092 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 1.11.2017 - 21:23 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
я стараюсь) на стаковерфлоу загуглил starting a daily time series in R test=ts(mydat$SALES,frequency=365, start=c(2015, 11)) #Хольт-Винтерс testforecast=HoltWinters(test,beta=F,gamma=F) testforecast$fitted я получаю фигню какую-то 2015.090 63.66014 63.66014 2015.093 63.69003 63.69003 2015.096 63.67381 63.67381 2015.099 63.69335 63.69335 2015.101 63.74642 63.74642 2015.104 63.75224 63.75224 2015.107 63.75847 63.75847 2015.110 63.75986 63.75986 2015.112 63.76634 63.76634 2015.115 63.81441 63.81441 2015.118 63.79887 63.79887 2015.121 63.78152 63.78152 2015.123 63.81786 63.81786 2015.126 63.88588 63.88588 2015.129 63.87830 63.87830 2015.132 63.86346 63.86346 2015.134 63.86787 63.86787 2015.137 63.86864 63.86864 2015.140 63.85490 63.85490 покажите, пожалуйста, как правильно нужно мне самому сложно |
Форум: Медицинская статистика · Просмотр сообщения: #22090 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 1.11.2017 - 20:49 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
'data.frame': 873912 obs. of 4 variables: $ DAY : Factor w/ 30 levels "01.11.2015","02.11.2015",..: 1 1 1 1 1 1 1 1 1 1 ... $ STORE: int 1534 25039 1612 1053 1612 961 1602 21761 19009 22691 ... $ ART : int 343533 20490 295206 16406274 49495 15309949 242763 188087 16350692 86093 ... $ SALES: num 62.5 686.4 185 32.5 143.1 ... day-день продажи STORE код магизина ART код товара SALES: цена даны данные по дням за месяц нужно предсказать значения за 30.11.2015 вот я и думаю что мне указать во фриквенси и что указать в параметре h |
Форум: Медицинская статистика · Просмотр сообщения: #22088 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 1.11.2017 - 20:38 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
p2004r, я немного изменил свой вопрос предсказываем переменную SALES это сумма покупок вопрос в том, что если мне нужно предсказать на один день вперед , какое значение нужно указать во frequency далее library("forecast") testforecast2=forecast.HoltWinters(testforecast,h=?) h это параметр который указывает насколько вперед предсказываем мне так и ставить единицу? т.е. 30-11.2015 |
Форум: Медицинская статистика · Просмотр сообщения: #22086 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 1.11.2017 - 16:41 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Подскажите, мне нужно построить предсказание по дням test=ts(datas$SALES,start=c(01-11-2015)) test Предсказание я делаю на базе продаж за месяц на день вперед , т.е. зная данные за месяц предсказать объем продаж на 30.11.2015 На всякий случай прикреплю данные переформулирую свой вопрос Usage ts(data = NA, start = 1, end = numeric(), frequency = 1, deltat = 1, ts.eps = getOption("ts.eps"), class = , names = ) если я прогнозирую на один день, что мне указать во фреквенси?
Прикрепленные файлы
|
Форум: Медицинская статистика · Просмотр сообщения: #22084 · Ответов: 26 · Просмотров: 25606 |
Отправлено: 29.09.2017 - 16:20 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Спасибо, теперь ясно |
Форум: Медицинская статистика · Просмотр сообщения: #21934 · Ответов: 2 · Просмотров: 4395 |
Отправлено: 28.09.2017 - 17:00 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Подскажите, пожалуйста, как правильно интерпретировать значение VIF в Spss? что значит эти значения 9,446 1,704 А также Variance Proportions что значит в третьем измерении у переменной x6 значение 0.81?
Прикрепленные файлы
|
Форум: Медицинская статистика · Просмотр сообщения: #21927 · Ответов: 2 · Просмотров: 4395 |
Отправлено: 3.09.2017 - 17:17 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Я использовал тот, что реализован в Statistica 10 как узнать какая именно это нелинейная регрессия регрессия? Сами данные тут год независимая переменная
Прикрепленные файлы
|
Форум: Медицинская статистика · Просмотр сообщения: #21882 · Ответов: 4 · Просмотров: 7061 |
Отправлено: 1.09.2017 - 11:56 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Из-за годичного представления информации, я решил лучше сделать нелинейную регрессию) |
Форум: Медицинская статистика · Просмотр сообщения: #21870 · Ответов: 4 · Просмотров: 7061 |
Отправлено: 29.08.2017 - 00:10 | |
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 |
Снова Анализ временных рядов). Подскажите, пожалуйста, какая модель годится для предсказание не по месяцам, тут то понятно Мультипликативная Винтерса, а по годам в таком формате 2006 2007 ... 2017 т.е. 11 наблюдений мне нужно сделать прогноз на 10 лет вперед до 2027 года. Какую модель Анализа временных рядов, лучше применить? |
Форум: Медицинская статистика · Просмотр сообщения: #21854 · Ответов: 4 · Просмотров: 7061 |
Открытая тема (есть новые ответы) Открытая тема (нет новых ответов) Горячая тема (есть новые ответы) Горячая тема (нет новых ответов) |
Опрос (есть новые голоса) Опрос (нет новых голосов) Закрытая тема Тема перемещена |