Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

4 страниц V   1 2 3 > » 

passant
Отправлено: 6.04.2018 - 11:44


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


А можно пердварительно попросить Вас прояснить, что в? имеете ввиду, говоря:
Цитата(Cules2013 @ 5.04.2018 - 23:18) *
доверительные интервалы, рассчитанные для исходных данных по каждой из выборок,

Вообще-то во всех книгах по статистике написано, что "термин, используемый для интервальной оценки статистических параметров, . Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью". Другими словами доверительный интервал может быть только для некоторого параметра выборки, но никак не для "исходных данных выборки".
Вот сижу и думаю, что-же вы ввиду-то имели? wink.gif
  Форум: Медицинская статистика · Просмотр сообщения: #22870 · Ответов: 12 · Просмотров: 880

passant
Отправлено: 4.04.2018 - 10:05


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Cules2013 @ 3.04.2018 - 16:19) *
Статистика - это не философия и не литературоведение, здесь должно быть всё чётко и понятно, а не "трактуй, как хочешь".

Вот тут вы ошибаетесь. В своей жизни я изучал одну единственную науку, в которой было все строго определено, выверено, безошибочно, четко и понятно - марксистско-ленинскую философию. Все остальные математики, физики, статистики, сопроматы, ТОЭ и прочие DataScience всегда строятся на огромном числе ограничений, допущений, предположений, трактовках, сомнений и пр.пр.пр smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #22862 · Ответов: 10 · Просмотров: 966

passant
Отправлено: 3.04.2018 - 10:17


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Cules2013 @ 3.04.2018 - 07:40) *
Уже давно мучает меня вопрос о том, где бы найти достоверную инфу (а не кто-то где-то примерно что-то сказал на просторах сети) о том, какие требования и допущения к каждому конкретному стат. методу/критерию..............
.........если их количество не менее 3, но не более 6.............
Хотелось бы знать конкретно, "что, куда и как". А то в сети слышал мнения, что .................
Проблема же ещё и в том, что несоблюдение подобных требований, отнюдь не значит, что стат программа откажется вам делать анализ. Она, скорее всего, преспокойно вам выдаст какую-то ахинею, а вы и не будете знать и поверите ей "на слово" ..........


Вы на самом деле зацепили два разных вопроса.
Ну, во-первых, конкретных цифр, подобно приведенным примерам, вы не найдете нигде (по крайней мере - в серьезных работах, а наличие таких цифр - лишний повод усомниться). Там будут более опекаемые формулировки, что в общем - понятно и правильно. Статистика по сути своей пытается дискретное пространство описать непрерывными категориями. А в непрерывном мире точных границ не существует по определению. Просто все понимают, что когда говорят, что "функция стремиться к нулю при X стремящемуся к бесконечности", то это может в реальном мире означать, что при некоторых, достаточно больших X функция станет неотличима с заданной точностью от нуля. А вот что такое "достаточно большие" и что такое "неотличима с заданной точностью" - при этом выносится за скобки. Так что, как правило, "что применимо при x=3, применимо и при x=4".
Во-вторых, вопрос касается того, а какие ограничения действительно существуют, работают или являются плодом воображения "кого-то там в сети". И вот тут засада. Для того, что-бы это понять, надо самому углубляться и разбираться в каждом методе. Почему? Да потому, что "то что сказано в сети" и "то что написано в умных книжках" отличается только тиражом распространения и доступностью, но не степенью "умности" или "глупости"вещей, там изложенных. Другими словами, кто-то (пусть даже очень авторитетный с вашей точки зрения) на форуме сказал "А", а в книге (тоже не менее авторитетной) написано "Б". Кому верить? Только прочитав и самому разобравшись можно "примкнуть к одному из лагерей". А часто и лагерей больше двух. Но заметьте, никто не даст гарантии, что ваша позиция действительно истинна. Ну, разве что Вы вступите в прямой контакт с Богом, да и то - не факт, что он хорошо разбирается в статистике :-).
Единственное, что можно и нужно сделать - помимо того, что самому разобраться в любом применяемом вами методе - это составить себе на каждый случай перечень всех понятых и принятых ЛИЧНО ВАМИ условий и ограничений, понимать как и не забывать их применять ВСЕГДА, когда вы используете этот метод . И еще - не менее важно - всегда уметь объяснить и обосновать то самое ваше личное мнение (а не просто сослаться на чей-то авторитет). Прислушаться к его критике и во время его изменять, если найдете критику основательной. И не отстаивать свое мнение только потому, что вы его высказали - это свойство исследователя я вообще выношу за скобки (и ставлю на первое, а вернее - нулевое место).
Так что вперед. Нужны ответы - не ждите готовых, а разбирайтесь и анализируйте их сами.
"Все сказанное выше является моим личным мнением, существующим на данный момент, может быть подвержено критике всех желающих и может быть мной изменено без предварительного оповещения" (С) - smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #22856 · Ответов: 10 · Просмотров: 966

passant
Отправлено: 27.03.2018 - 09:53


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(leo_biostat @ 26.03.2018 - 18:26) *
Поскольку очень часто все вопрошающие не очень ясно и понятно формулируют свои вопросы.

Если человек не может ясно и понятно сформулировать свой вопрос, то в 99% случаях это означает, что он и проблемы своей по сути не понимает. Может стоит в таких случаях начинать с того, что "вытягивать" его на корректную формулировку? Думаю, это будет и ему и многим будущим "новичкам" форума весьма полезно.

Цитата(leo_biostat @ 26.03.2018 - 18:26) *
И тогда желающий оказать Вам помощь вызовет Вас, и проведёт собеседование. Вот и получите эту помощь.

И тогда на форуме окончательно перестанут накапливаться ответы на вопросы и каждый новый "вопрошающий" вынужден будет решать свою проблему с нуля.
Как бы там ни было, сегодня если в Гугле забить определенные вопросы, кстати - даже по проблемам далеким от медицины, довольно часто мы попадаем на этот форум. Мне самому доводилось именно так несколько раз "переоткрывать" этот форум и выяснять для себя что-тот новое. И доводилось направлять людей, которые ко мне обращаются за консультациями по НЕмедицинским вопросам, к темам форума. Переход на приватные консультации в Скайп эту "фичу" убьет окончательно и бесповоротно.


Цитата(leo_biostat @ 26.03.2018 - 18:26) *
N.B.! Рекомендую Админам Форума дополнить это предложение по Скайпу в рекомендации общения по всем разделам Форума.

И превратить форму из платформы обмена знаниями в платформу поиска консультацийнтов. Впрочем - у каждого свои интересы.
  Форум: Медицинская статистика · Просмотр сообщения: #22808 · Ответов: 13 · Просмотров: 1292

passant
Отправлено: 25.03.2018 - 19:21


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Вообще-то, согласно классическому определению:
"Критерии однородности - это критерии проверки гипотез о том, что две (или более) выборки взяты из одного распределения вероятностей"
Поэтому, действительно, загадка, что имелось ввиду, когда говорилось " Как .... проверить что выборка (в единственном числе !!!!) в группе 1 однородная" (За одно, можно и поинтересоваться, почему стоит вопрос про группу #1, а про группу #2 не говориться ничего)
Но нам тут не привыкать к "точным" форулировкам sad.gif . Можно, как обычно, попробовать угадать wink.gif , что в данном случае автор имел ввиду "равномерность распределения значений выборки". И если это так - то напомнить автору, что для этой задачи есть критерий Шермана, критерий Морана, и далее по списку (см. например, справочник Кобзаря).
Впрочем, исходя из того, что надо "проверить как различаются группы по ряду параметров" может я и не угадал wink.gif. Ну, тогда надо все-таки "дожать" автора на корректное изложение задачи.
  Форум: Медицинская статистика · Просмотр сообщения: #22803 · Ответов: 13 · Просмотров: 1292

passant
Отправлено: 9.03.2018 - 18:46


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Осмелюсь дать ссылочку на блог нашего уважаемого коллеги по форуму.
http://biostat-r.blogspot.com/2015/03/trialsize.html
Хоть ссылка явно с медицинским уклоном, но информацию по математике метода, который независим от прикладной области, там найти можно. Ну и ссылочка для дальнейшего углубления в тему при необходимости - тоже есть.
  Форум: Медицинская статистика · Просмотр сообщения: #22752 · Ответов: 2 · Просмотров: 732

passant
Отправлено: 9.03.2018 - 18:17


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(nastushka @ 9.03.2018 - 14:08) *
Я вроде нашла
это sparse matrix, я это имела ввиду
https://stackoverflow.com/questions/1200907...e-sparse-matrix

А какое это имеет отношение к "тесту на то, является-ли матрица действительно разряженной" ?
В ссылке явно сказано "it seems it doesn't work on sparse matrix." Т.е. оказывается, что некоторый конкретный метод не работает (а по сути, это означает, как привило, что метод что-то там считает, но то-ли результат неточен или вообще расходится, то-ли алгоритм работает слишком медленно или вообще зацикливается - никто не знает, что означает "не работает") если в матрице "очень много" пустых (или нулевых) клеток. При этом другие алгоритмы, разработанные специально для случаев, когда в матрице "преимущественно" пустые клетки - с задачей справляется. И только.
Ну, если очень нужен тест, возьмите свои данные, прогоните через этот алгоритм, если он "не сработает" - можете смело считать, что тест "на разряженность матрицы" успешно пройден.
  Форум: Медицинская статистика · Просмотр сообщения: #22751 · Ответов: 3 · Просмотров: 487

passant
Отправлено: 8.03.2018 - 16:36


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(nastushka @ 8.03.2018 - 14:38) *
Подскажите, есть ли статистический тест, который поможет проверить, что матрица данных данных действительно разряжена?

Сначала дайте СТРОГОЕ определение, что такое разряженная матрица smile.gif . Если ВДРУГ вам это удастся, то тогда без проблем окажется протестировать.
(Что бы было понятнее - взгляните на любое определение разряженности матрицы, начиная с Википедии. Наверняка там найдете слово "преимущественно" "очень велико", "на много больше" и т.д. И подумайте, можно-ли такое определение считать строгим и формальным.
И еще. Введение понятия "разряженная матрица" было вызвано попыткой оптимизировать вычислительные алгоритмы, а никак не собственно какими-то исключительными внутренними особенностями, присущими таким структурам)
  Форум: Медицинская статистика · Просмотр сообщения: #22744 · Ответов: 3 · Просмотров: 487

passant
Отправлено: 3.03.2018 - 16:18


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Думаю, для тех, кто решил ознакомиться с R - будет весьма полезна.
А для тех, кто уже знаком - хорошим справочником-напоминалкой.
http://books.goalkicker.com/RBook/
И - главное - официально свободно распространяемое издание "Please feel free to share this PDF with anyone for free"
  Форум: Медицинская статистика · Просмотр сообщения: #22715 · Ответов: 0 · Просмотров: 577

passant
Отправлено: 26.02.2018 - 17:26


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(DrgLena @ 26.02.2018 - 00:47) *
Я думаю, что вы не правильно поняли. Баллов после операции нет. Обе оценки сделаны до операции. Вторая оценка характеризует больного после какого то времени ОЖИДАНИЯ операции. И это написано ясно.

Да, Вы правы. Перечитал еще раз - именно так. Просто мне, как "не врачу", сложно было представить, что можно откладывать необходимую операцию просто для того, что-бы доказать гипотезу, что "чем больше ждем, тем хуже становиться больному".
  Форум: Медицинская статистика · Просмотр сообщения: #22686 · Ответов: 12 · Просмотров: 894

passant
Отправлено: 26.02.2018 - 17:20


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Daria @ 26.02.2018 - 09:31) *
"..."линейная кривая" и как вы ее себе представляете - это загадка"
Да, я неверно выразилась. Но смысл, думаю, понятен. Графическое преставление линейной зависимости, наверное, так.

"линейная кривая"=="Графическое преставление линейной зависимости" == (самое сложнонаучное и математикозаумное название) "прямая" lol.gif (ну,
или "плоскость" в многомерном случае).
  Форум: Медицинская статистика · Просмотр сообщения: #22685 · Ответов: 12 · Просмотров: 894

passant
Отправлено: 26.02.2018 - 00:49


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Начнем с представления данных. Если я правильно понял, и ДЛЯ КАЖДОГО БОЛЬНОГО у вас есть информация по состоянию до и после операции, то на самом деле ваши данные немного другие. А именно, представьте, что у вас есть таблица со следующими столбцами:
Пациент (id), Баллы по шкале до операции (БДО), Время ожидания операции (ВО), Баллы по шкале после операции (БПО).
Вот теперь можно и корреляцией заняться, например выяснить, коррелированы-ли БПО и БДО. БПО и ВО. И да, нужно применять двухвыборочные методы для зависимых выборок. Можно попытаться применить и множественную корреляцию. Главное помните, что БПО и БДО у вас измерены в ранговых шкалах, а ВО - в количественной, и методы надо выбирать соответствующие.
Дальше можно попробовать построить модель зависимости БПО от БДО и ВО. Правада, что такое "линейная кривая" rolleyes.gif и как вы ее себе представляете - это загадка. А поскольку Ваши БПО и БДО представлены в ранговых шкалах (это насколько я понял), то строго говоря вы должны строить не регрессионную, а классификационную модель. Каким методом - тут конечно надо немного подумать, но ваша задача вполне классическая и описана почти дословно во многих книгах по мед.статистике.
"Регрессионная модель с фиксированными и случайными эффектами" - с моей точки зрения, это вас уже занесло как-то очень далеко не туда.
"можно реализовать и в SPSS, и в Stata", - Можно. Можно и в R, и в Python, и даже в EXCEL. Реализовывайте в том, что вы лично лучше знаете.
  Форум: Медицинская статистика · Просмотр сообщения: #22679 · Ответов: 12 · Просмотров: 894

passant
Отправлено: 22.02.2018 - 15:33


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(nastushka @ 22.02.2018 - 14:04) *
Подскажите, как можно решить такую задачу
1. есть данные, в них 20 переменных
2. нужно кластеризовать эти 20 переменных, т.е. выделить классы схожим переменных
3.затем найти людей, которые "кучкуются" у каждого класса переменных.
Например мы нашли 4 класса переменных абв, где, ежз, икл. наблюдения 1-30 кучкуются у класса к примеру ежз.

Что-то у вас все в кучу, мухи, котлеты, переменные, наблюдения, кластеры, классы, "кучки".... sorry.gif
Во-первых. Что такое "классы схожих переменных"? Вы имеете ввиду, что некоторые переменные у вас зависимые (коррелированны) между собой? И вы хотите из группы сильно коррелированных переменных оставить только одну? В любом случае, "классами" эти переменные я бы называть поостергся, а уж тем более их "кластеризовать"
Во-вторых. Что значит "кучкуются у каждого класса переменных"??? unknw.gif Тут у меня даже фантазии не хватает понять, что вы имеете ввиду.
В любом случае, рекомендую сначала прочитать хотя-бы краткое введение в кластерный анализ. Может - поймете сами чего нужно, но по крайней мере - сумеете хоть внятно объяснить свою задачу в общеупотребимых терминах
Или второе возможное действие - описать вашу прикладную задачу, и дать возможность специалистам самим разобраться кого и куда "кластеризовать" smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #22662 · Ответов: 9 · Просмотров: 949

passant
Отправлено: 16.02.2018 - 21:00


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(med-ick @ 16.02.2018 - 17:09) *
Несмотря на то, что в медицине методы data mining не используются,


Очень сильно надеюсь, что Вы просто прикалываетесь.
Верю, что любой мало-мальский специалист (и в медицине в том числе) понимает, где, как и для чего в его области знаний могут и -главное(!!!!) --- уже применяют методы анализа данных, ИИ, нейронные сети и пр.
Иначе - можно остаться без работы wink.gif :
Вот, уже началось : http://ai-news.ru/2017/11/kitajskij_ii_pol...ziu_vracha.html
http://ai-news.ru/2017/12/iskusstvennyj_in...chej_trend.html

Ну, а если серьезно, и Вы почему-то проспали, что делается в этом направлении в мире - то кратенькая подборка с лёту, так сказать для входа в тему:
https://towardsdatascience.com/deep-learnin...is-c04d35fc2830
https://habrahabr.ru/company/mailru/blog/325908/
https://www.kdnuggets.com/2017/04/medical-i...ing-part-2.html
https://www.cio.com/article/3235445/healthc...healthcare.html
https://stanfordmlgroup.github.io/projects/ecg/
https://tensorflow.rstudio.com/blog/dl-for-...unotherapy.html
https://nplus1.ru/material/2017/01/20/smart-medicine
https://nplus1.ru/news/2018/02/08/apple-watch-diabetes
Совсем свеженькое
https://geektimes.ru/post/298187/
и классика жанра
https://www.ibm.com/watson/health/
и так далее.........

А вообще-то, наверное Вы правы. Постоянно сталкиваюсь с тем, что уровень даже не столько знаний наших врачей, но уровень их желания даже разобраться в этом вопросе, просто почитать что и как - как-бы это сказать помягче, что-бы никого не обидеть - примерно никакой. Приходишь, предлагаешь, говоришь - давайте попробуем, давайте сделаем хоть малюсенький шаг -- а в ответ тишина (в лучшем случае) или полуагрессивное отторжение. А жаль. sad.gif Я все понимаю, вам людей каждый день лечить, с того света часто вытягивать, Я восхищаюсь и преклоняюсь за это перед медиками. Понимаю, что вам часто не до траты времени на всякие заумные новшества. Но.... Грустно.
  Форум: Медицинская статистика · Просмотр сообщения: #22644 · Ответов: 3 · Просмотров: 428

passant
Отправлено: 15.02.2018 - 13:00


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(DrgLena @ 15.02.2018 - 00:00) *
Предлагаю окончить столь содержательную дискуссию о рандомизации, меланхолия ваша, видимо, заразная.

Пересмотрел еще раз тему. Имеем: 24 СЛУЧАЙНО ОТОБРАННЫХ пациентов требуется разбить на две группы СЛУЧАЙНЫМ образом. Всего-то!. И уж сюда и Statistica, и R, и EXCEL в ход пошли. И строго наукообразные методы рандомизаци. Не хватает только Hadoop, Watson и Blockchain. smile.gif . А делов-то - на 24 бумажках написать фамилии (или номера),перемешать и вытянуть из шапки случайным образом. Между прочим, теоретически - действительно, самое "случайное" из возможных решений. Но нет, свирепый высоконаучный совет-редакция не пропустит. smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #22634 · Ответов: 35 · Просмотров: 4712

passant
Отправлено: 12.02.2018 - 17:11


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 12.02.2018 - 16:55) *
Особенно интересует формула пересчета действительного числа из [0;1] в целый индекс от 1 до 24.

Ну, этого, как раз при предлагаемой методике делать и не надо. Да и не сложно это, кстати. По-крайней мере в этом я за своих студентов спокоен (у меня - ИТ-шники, если что)smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #22614 · Ответов: 35 · Просмотров: 4712

passant
Отправлено: 12.02.2018 - 16:39


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(nokh @ 11.02.2018 - 16:02) *
У меня есть заготовка с ответом из выходящего в этом году Лабораторного практикума по биостатистике, но только в Excel - прикрепил.

Посмотрел Ваш файл. Как мне кажется, для корректной работы там пропущен один пункт. Между п.3 и п.4. надо вставить превращение динамически генерируемых чисел в статические значения, т.е. выделить оба столбца, выбрать "копировать", потом выбрать"Главная"-> "Вставка"->""специальная вставка" -> "значения"-> OК.
По крайней мере, в последних версиях EXCEL (2007 и выше) так. Иначе, он делает перегенерацию случайных чисел прямо в процессе сортировки.
Второй путь - отключать в настойках EXCEL автоматический пересчет формул, но это уже извращение.
Зная подходы к учебе у студентов, я бы все-таки это вписал в методичку, а то задерут вопросами :-)
  Форум: Медицинская статистика · Просмотр сообщения: #22612 · Ответов: 35 · Просмотров: 4712

passant
Отправлено: 11.02.2018 - 14:31


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Вообще-то на картинке мы видим совершенно классический случай, который рассматривается на первых страницах любого учебника или сайта по временным рядам. (Например http://statsoft.ru/home/textbook/modules/sttimser.html). Ряды такого типа особенно характерны для эконометрических задач, где и исследуются весьма подробно. (Например - http://eos.ibi.spb.ru/umk/4_5/5/print/5_R1_T6.pdf , http://baguzin.ru/wp/4-3-prognozirovanie-i...nirovanie-v-ra/ ). Называются они - рядами с сезонной составляющей (слово "сезонный" не должно смущать, в данном случае период сезонности может быть и несколько секунд, и неделя, и год, и тысячелетие). Для таких рядов придуманы специальные методы - и для формального обнаружения сезонности и выявления их отличий от просто хаотических колебаний, и для выявления периода сезонности (опят-же, не на глаз, а формально), причем в одном ряду могут быть несколько различных сезонных составляющих, и для прогнозирования поведения ряда, в модели которого присутствуют сезонные компоненты и даже для обнаружения аномалий сезонности.
Естественно и в R доступны средства для работы с сезонностью, например:
http://a-little-book-of-r-for-time-series....timeseries.html
https://shiring.github.io/forecasting/2017/...orcasting_part3
https://petolau.github.io/Regression-trees-...me-series-in-R/
и много много других.
Поэтому, думаю, если автору действительно хочется сделать серьезную работу, а не строить свой велосипед, следует ознакомиться с упомянутым подходом. А если это просто "проходная" задача - то можно, конечно, и "на глазок".
  Форум: Медицинская статистика · Просмотр сообщения: #22599 · Ответов: 22 · Просмотров: 1662

passant
Отправлено: 10.02.2018 - 22:01


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Не хотите Вы слушать, что Вам говорят.
Ну тогда взгляните на Рис1. (Правда, я тут намедни инсталлировал новую для себя версию EXCEL и мне было интересно за одно поиграться с ней. Так что не на R, уж не обессудте.)
Вы еще хотите после этого применять чисто линейную регрессионную модель? Ну пожалуйста.
EXCEL в два клика дает значения коэффициентов линейной регрессии (Рис.2).
Получаем, подставляем, строим график (Рис.3). Желтая - регрессия внутри имеющейся серии, красное - прогноз.
Ну уверен, что такой прогноз хоть в чем-то может оказаться полезен, хотя.....
Эскизы прикрепленных изображений
Прикрепленное изображение
Прикрепленное изображение
Прикрепленное изображение
 
  Форум: Медицинская статистика · Просмотр сообщения: #22594 · Ответов: 22 · Просмотров: 1662

passant
Отправлено: 10.02.2018 - 14:03


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


ЕСЛИ ((Вы уверены, что у вас линейная регрессионная модель может что-то предсказать на период 14 дней) И (у Вас действительно ежедневные данные за предыдущий период))
ТО
использование специализированных средств работы с временными рядами Вам не нужно.

Все что Вам надо:
1. Создаете фрейм:
- первый столбец - номер дня (именно так - первый день наблюдения -1, второй день наблюдения - 2...... последний день наблюдения - (например)20).
- второй столбец - значения наблюдения в соответствующий день.
2. Скармливаете эти данные функции lm(с2~c1,...). Получаете модель.
3. Подставляете дни, на которые вам надо сделать прогноз - в нашем примере - 21,22,.....34 (если надо на две недели вперед).
4.ЕСЛИ у Вас не нарушены основные предположения (т.е. модель действительно имеет линейные тренд, И он сохраняется на весь период прогнозирования)
ТО наслаждаетесь результатами;
ИНАЧЕ
Применяете другие подходы;
  Форум: Медицинская статистика · Просмотр сообщения: #22591 · Ответов: 22 · Просмотров: 1662

passant
Отправлено: 9.02.2018 - 21:12


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Применять можно любую модель - хоть скользящее среднее, хоть регрессию, хоть фильтрацию Калмана, хоть любой другой метод. Другое дело, что надо понимать, что для каждого конкретного случая одни модели будут работать точнее, чем другие. Прогноз будет более точным или менее точным. И, кстати, почему "простую линейную регрессионную"? Ведь даже в классе регрессионных моделей могут быть и нелинейные?
Универсального метода нет и надо экспериментировать.
  Форум: Медицинская статистика · Просмотр сообщения: #22587 · Ответов: 22 · Просмотров: 1662

passant
Отправлено: 29.01.2018 - 01:58


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


На самом деле вопрос перевернут с ног на голову. "Профессиональные математики и статистики" не придумывают задачи. Они только помогают специалистам в конкретных доменах (прикладных областях знаний) решать задачи этих областей. Не даром наука о данных предполагает триедиство - "стат.методы/датамайнинг+программный инжиниринг+знание в домене". И даже пример этого форума показывают, что задачи ставят медики-биологи, а математики-статистики только помогают им их решать. Так что если Вы уж "назвались груздем" - то есть специалистом по анализу - то осваивайте те задачи, которые характерны для вашей области, в данном случае - для анализа социальных сетей.
Вообще-то "анализ социальных сетей" - это отдельная специальность, которой обучают в ВУЗе. И нахрапом там - как впрочем и в других областях - многого не достигнешь. А так, на вскидку, из ваших данных можно вытянуть, например, информацию о том, зависит-ли интересы пользователя от определенных демографических и социологических данных и их комбинаций. Информацию о том, что люди из одной группы склонны к участию в каких-то других. Или как интересы человека изменяются со временем. Или сколько детей имеют люди определенной профессии. Даже эти игрушечные примеры могут оказаться весьма интересны для маркетологов. Например для того, что-бы в конечном счете построить некоторую рекомендательную систему.
Так что - спрашивайте в первую очередь тех, кто заказал вам исследование. Или сами "въезжайте" в тему. А уж потом "математики и статистики" смогут вам чем-то помочь.
Удачи.
  Форум: Медицинская статистика · Просмотр сообщения: #22521 · Ответов: 5 · Просмотров: 964

passant
Отправлено: 24.01.2018 - 23:05


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Fedor_Petuhov @ 24.01.2018 - 21:47) *
help.gif, пожалуйста, как мне правильно рассчитать размер контрольной выборки, чтобы оценить отклик. Например, клиенту предлагается покупка услуги, есть экспериментальная группа, в размере 100 человек, им предлагается услуга определенным способом.
А есть контрольная группа, им предлагается стандартным образом. Гипотеза, что если предлагать услугу определенным образом, процент откликнувшися на нее будет больше. Чтобы проверить эту гипотезу, как мне рассчитать какое количество выборки должно быть в контрольной группе? Мы тут сравниваем пропорции.

1. http://biostat-r.blogspot.com/2015/03/trialsize.html
2. http://r-video-tutorial.blogspot.com/2017/...ample-size.html
  Форум: Медицинская статистика · Просмотр сообщения: #22484 · Ответов: 5 · Просмотров: 505

passant
Отправлено: 23.01.2018 - 18:02


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(зоо @ 23.01.2018 - 11:33) *
Ещё вопросик возник. Я полиномом приблизил точки см. скрин. Правильно ли так приближать или есть более крутое решение

Это - самое НЕ крутое решение. Называется - переобучение. Типичная ошибка юных пионеров статистиков. Представте, у вас добавилась (или убралась) всего одна точка. Мало того, что вся ваша модель должна быть пересчитана, так еще и новая модель может очень существенно, иногда - кардинально, отличаться от первой. А это противоречит здравому смыслу и физике процесса.
  Форум: Медицинская статистика · Просмотр сообщения: #22480 · Ответов: 13 · Просмотров: 967

passant
Отправлено: 23.01.2018 - 17:57


Дух форума
*

Группа: Пользователи
Сообщений: 103
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 23.01.2018 - 15:23) *
Еще более очевидно, что да. Метод называется Supporting Vector Machine (SVM).

Дополню. И не только SVM-методом.
Простейшее решение, основанное на школьной математике - перейти из декартовых в полярные координаты представления данных. Где задача решается тем самым методом "линейного разделения".
  Форум: Медицинская статистика · Просмотр сообщения: #22479 · Ответов: 13 · Просмотров: 967

4 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена