Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Обработка данных по циркадным ритмам
ivan_m
сообщение 12.10.2013 - 09:11
Сообщение #1





Группа: Пользователи
Сообщений: 6
Регистрация: 20.02.2012
Пользователь №: 23503



Доброго времени суток, уважаемые форумчане!
Позвольте задать вопрос, ответа на который не смог найти на форуме:
Задача:
Есть данные количества посещений веб-сервиса студентами по времени суток (т.е. по каждому часу суток количество посещений для каждого студента персонально).
Есть результаты опроса этих студентов на предмет их предпочитаемого суточного ритма (т.е. сумма баллов в диапазоне от 0 до 25, отражающая континуум от "полного жаворонка" (0) до "полной совы" (25))
Нужно оценить корреляцию суточного ритма (точнее степени предпочтения "вечернести") по данным анкеты и суточного ритма посещений сайта.
Вопрос: как же обработать данные о количестве посещений по часам?
Мне пришло в голову только, что данные посещений по часам можно пересчитать с учетом часа и вычислить некую среднюю
т.е. если
9ч утра - 5 посещений
10 - 7
11 - 8
и пр.
то считаем так: ((9*5)+(10*7)+(11*8) и далее) / (5+7+8 и далее)
получается некое значение ("средний час"??), корреляцию которого с данными опросника можно оценить.
естественно, более корректно будет ввести дополнительную поправку, что сутки с точки зрения учебы начинаются не в 00.00, а с 6 утра (когда по общей статистике начинается нарастание количества посещений) и при перемножении умножать не на конкретный час (9,10,11 и далее), а на час отсчитанный от 6 утра (соответственно вместо 9,10,11 - 3,4,5).
но в целом насколько корректен такой подход, мне не очень понятно.
может быть есть еще какие-то варианты более корректной обработки подобных данных?
тем более, что если посмотреть распределение посещений в целом, то там ясно прослеживаются два суточных пика - утром и вечером. В середине дня - снижение количества.

Сообщение отредактировал ivan_m - 12.10.2013 - 16:20
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
p2004r
сообщение 13.10.2013 - 21:55
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699




У Вас временной ряд у каждого студента. Есть два подхода:

1) Навязываете "внешний" календарь. То есть 24 часа + 7 дневка + месяц (получки всякие коррелируют) + год (если данные достаточно длинные, то дни рождения и прочие праздники проявятся + времена года (или явно празники + времена года + сесии-каникулы)). В принципе добавив фактор "студент" можно применить lmer глобально ко всему датасету. Ваш фактор "совости" добавить в модель и доказать что она улучшилась от этой информации.

2) Выявляете имеющийся собственный ритм ряда разлагая его на составляющие тем или иным методом из весьма обширного арсенала. После этого составляющие разных студентов (раз ?имеется? общая ось времени) просто смотреть эксплораторными методами в поисках закономерностей. Есть методы кластеризации временных рядов без разложения на составляющие. Можно строить модели марковских цепочек со скрытыми состояниями. Методов очень много.




Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему