Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Подскажите, пожалуйста с методологией исследования
Fedor_Petuhov
сообщение 24.11.2017 - 14:53
Сообщение #1





Группа: Пользователи
Сообщений: 29
Регистрация: 10.02.2017
Пользователь №: 29307



Всем hi.gif, у меня очень непростая задача, поэтому решил попросить помощи в оценке методологии исследования.
Проводится исследование влияния рекламной телекомпании на трафик на сайте. То есть рекламодатель с разным промежутком времени показывает 10-секундное видео. Необходимо оценить эти временные интервалы, когда на сайте имеется всплекс трафика. Другими словами, как правильно выбрать временные интервалы показа рекламы по тв, после чего идет всплекс трафика на сайте.
т.е.
В определенную минуту времени происходит всплеск значений переменной.
как это:
https://i.stack.imgur.com/lyaDc.jpg
То есть
Код
     время ролика      значение в людях посетивших  сайт
     6:11                               1
     6:24                             25
     6:25                             845
     6:40                             54
     6:53                            225
     6:55                               2
     7:12                             3
     9:22                            435
     9:31                               4
     9:34                              5
     9:55                              65
     10:15                               3

Здесь мы видим, что пиковые значения происходят в интервале, в среднем, каждые 20 минут.
Например, после рекламы по телевизору.

1. 6:11 только 1 человек посетил веб-страницу
2. 6:24, 25 человек посетили веб-страницу
3. и 6:25 мы видим прохладный пик, 845 человек посетили.

Под пиком понимается всплеск посещений сайта (измеряется по количеству посещенных людей).

Как я могу выбрать правильный период времени с использованием R?
Существуют ли способы автоматического определения правильного периода времени для пиков?
Это не простой вопрос. В этой задаче временные интервалы не проходят равномерно

7:20 - пик
7:40 - пик
8:00 - пик

они могут пойти

6:00 - пик
6:20 - пик
6:40 - пик
и следующий пик
7,30 - пик
тогда
7:40 - пик


возможно ли получить на выходе фрейм данных?
где пик (0 - не пик, 1 - пик), а интервал - это время после пика (в минутах)



Код
время    значение    пик    интервал в минутах
        6:11                    1    0    0
        6:24                    25    0    0
        6:25               845    1    20
        6:40                  54    0    0
        6:53                225    1    25
        6:55                    2    0    0
        7:12                    3    0    0
        9:22               435    1    122
        9:31                   4    0    0
        9:34                  50    0
        9:55                 65    0    0
        10:15            3    0    0


help.gif, пожалуйста. У меня версий никаких нет.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 24.11.2017 - 17:46
Сообщение #2





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Fedor_Petuhov @ 24.11.2017 - 14:53) *
Всем hi.gif, у меня очень непростая задача, поэтому решил попросить помощи в оценке методологии исследования.
Проводится исследование влияния рекламной телекомпании на трафик на сайте. То есть рекламодатель с разным промежутком времени показывает 10-секундное видео. Необходимо оценить эти временные интервалы, когда на сайте имеется всплекс трафика. Другими словами, как правильно выбрать временные интервалы показа рекламы по тв, после чего идет всплекс трафика на сайте.
т.е.
В определенную минуту времени происходит всплеск значений переменной.
как это:
https://i.stack.imgur.com/lyaDc.jpg
То есть
Код
     время ролика      значение в людях посетивших  сайт
     6:11                               1
     6:24                             25
     6:25                             845
     6:40                             54
     6:53                            225
     6:55                               2
     7:12                             3
     9:22                            435
     9:31                               4
     9:34                              5
     9:55                              65
     10:15                               3

Здесь мы видим, что пиковые значения происходят в интервале, в среднем, каждые 20 минут.
Например, после рекламы по телевизору.

1. 6:11 только 1 человек посетил веб-страницу
2. 6:24, 25 человек посетили веб-страницу
3. и 6:25 мы видим прохладный пик, 845 человек посетили.

Под пиком понимается всплеск посещений сайта (измеряется по количеству посещенных людей).

Как я могу выбрать правильный период времени с использованием R?
Существуют ли способы автоматического определения правильного периода времени для пиков?
Это не простой вопрос. В этой задаче временные интервалы не проходят равномерно

7:20 - пик
7:40 - пик
8:00 - пик

они могут пойти

6:00 - пик
6:20 - пик
6:40 - пик
и следующий пик
7,30 - пик
тогда
7:40 - пик


возможно ли получить на выходе фрейм данных?
где пик (0 - не пик, 1 - пик), а интервал - это время после пика (в минутах)



Код
время    значение    пик    интервал в минутах
        6:11                    1    0    0
        6:24                    25    0    0
        6:25               845    1    20
        6:40                  54    0    0
        6:53                225    1    25
        6:55                    2    0    0
        7:12                    3    0    0
        9:22               435    1    122
        9:31                   4    0    0
        9:34                  50    0
        9:55                 65    0    0
        10:15            3    0    0


help.gif, пожалуйста. У меня версий никаких нет.


Для затравки: в целях выявления периодичностей во временном ряду люди добрые смотрят на периодограмму и определяют статистическую значимость ее пиков.
А теперь предлагаю обсудить мой гонорар.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Fedor_Petuhov
сообщение 26.11.2017 - 13:51
Сообщение #3





Группа: Пользователи
Сообщений: 29
Регистрация: 10.02.2017
Пользователь №: 29307



100$, а можно перед обсуждением вашего гонорара)) узнать , как в R строить периодограмму и определить стат.значимости её пиков
хотя бы намекнуть на библиотеки. Мне ж многого не надо. я человек без запросов)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 26.11.2017 - 15:15
Сообщение #4





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Fedor_Petuhov @ 26.11.2017 - 13:51) *
100$, а можно перед обсуждением вашего гонорара)) узнать , как в R строить периодограмму и определить стат.значимости её пиков
хотя бы намекнуть на библиотеки. Мне ж многого не надо. я человек без запросов)




В R есть базовая ф-ция spectrum(ts), где ts - сами понимаете что. Особенно приятно, что она выдает в т.ч. и сглаженную (smoothed) окном Даниэля версию. Это чтобы не возиться со статистической значимостью.

Сообщение отредактировал 100$ - 26.11.2017 - 15:20
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Fedor_Petuhov
сообщение 1.12.2017 - 14:44
Сообщение #5





Группа: Пользователи
Сообщений: 29
Регистрация: 10.02.2017
Пользователь №: 29307



100$, прошу простить, что не писал 4 дня. Я пытался сам решить проблему, но не получилось.
Смотрите, функция spectrum это спектральный анализ. График я получил, а как в датафрем вывести время и пиковые точки
нечто вроде
14:43 3456
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 1.12.2017 - 15:22
Сообщение #6





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Fedor_Petuhov @ 1.12.2017 - 14:44) *
100$, прошу простить, что не писал 4 дня. Я пытался сам решить проблему, но не получилось.
Смотрите, функция spectrum это спектральный анализ. График я получил, а как в датафрем вывести время и пиковые точки
нечто вроде
14:43 3456


Цитата
прошу простить, что не писал 4 дня

Вот уж не за что. Это же форум. Здесь никто не проводит бессонных ночей в ожидании реплики собеседника ).

Цитата
График я получил

Ну, график-то прикрепите, не жадничайте ).

Цитата
а как в датафрем вывести время и пиковые точки


data.frame(Время, Пиковые точки). Нет?

Сообщение отредактировал 100$ - 1.12.2017 - 15:32
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Fedor_Petuhov
сообщение 8.12.2017 - 14:48
Сообщение #7





Группа: Пользователи
Сообщений: 29
Регистрация: 10.02.2017
Пользователь №: 29307



100$, не совсем, неделя исканий и вуаля, вот что я имел ввиду)
df <- data.frame(freq = spectrum(l)$freq, spec = spectrum(l)$spec[,2])

полный код

Код
l=read.csv("C:/Users/Admin/Desktop/l.csv",sep=";", dec=",")
l=ts(l)
spectrum(l)
df <- data.frame(freq = spectrum(l)$freq, spec = spectrum(l)$spec[,2])


Но почему тут отображаются частоты и спектр
Мне бы для большой наглядности, чтобы тут отображались
абсолютные значения времени и пиков
Эскизы прикрепленных изображений
Прикрепленное изображение
 

Прикрепленные файлы
Прикрепленный файл  l.zip ( 211 байт ) Кол-во скачиваний: 186
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему