Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

5 страниц V   1 2 3 > » 

passant
Отправлено: 17.05.2018 - 13:57


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Zamira @ 17.05.2018 - 12:00) *
Добрый день. Подскажите,пожалуйста, как правильно рассчитать тертили?

Вот тут разжевано относительно доступно:
https://sites.google.com/site/konstbel/knig...drugie-kvantili
  Форум: Медицинская статистика · Просмотр сообщения: #23014 · Ответов: 1 · Просмотров: 119

passant
Отправлено: 13.05.2018 - 12:23


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(scholar @ 12.05.2018 - 19:22) *
Есть ли статистические техники оценки динамики только по средним?

Динамики чего?
Цитата(scholar @ 12.05.2018 - 19:22) *
например признак А имел среднее значение полгода тому назад 30, а сейчас 20, т.е. на 10 снизился.

Имея только эти два числа все, что вы можете о них сказать - вы сказали.
Кстати - достаточно много: и то, что одно (какое именно) меньше другого (порядковое сравнение) , и то, на сколько меньше (количественное сравнение), а если вы еще и знаете, что произошло это за пол года (т.е. присутствует фактор времени) - то вот вам и динамика smile.gif Что еще вы хотели-бы узнать?
  Форум: Медицинская статистика · Просмотр сообщения: #22999 · Ответов: 2 · Просмотров: 129

passant
Отправлено: 9.05.2018 - 13:19


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 9.05.2018 - 00:48) *
passant, а как вы дихотомическую переменную, имеющую биномиальное распределение "Отсутствует/Присутствует" сумели так ловко объединить с переменной, имеющей мультиномиальное распределение? Это ж прямо прорыв какой-то. Ловкость рук, и никакого мошенства.
Корректная оценка - 77/40=1,925.


1. Не пойму, о чем речь, честно.
Исходно данные о локализации- а их пять, по месту - действительно имеют дихотомическую природу. "Есть порожение в данной точке"/"Нет поражения в данной точке".
Т.е. привели собачку, появилась запись следующего вида:
"Порода: "Сербернар",
Поражено ухо: "Да",
Поражены лапы: "Да",
Поражен живот: "Нет",
Поражена спина: "Да",
Поражен хвост: "Нет".
У ТС набралось 88 таких записей. Для дальнейшего анализа объединяем их в единую таблицу по породам. В таблице оказалось восемь строк. Одна строка - данные об одной из пород. Каждая из строк выглядит так: "X1 собачек данной породы имеют локализацию поражения "Ухо",..... "X5 собачек данной породы имеют локализацию поражения "Хвост". В итоге получаем Классическое исходное представление таблицы сопряженности. Где тут вы нашли необычное "объединение биноминальной с мультиномиальнй переменной", и "ловкость рук и никакого мошенства"???

Кто-то тут ссылался на Аптона. Ну так открываем его книгу, глава 3. Примеры там приведенные - с точностью до переименования переменных - совпадают с рассматриваемой в данной теме задачей. На основе описанной таблицы легко можно получить ответ на вопрос, "отличается ли частота встречаемости локализации A" у бультерьера и пинчера. Или "отличается ли частота встречаемости локализации B" у спаниеля и "среднестатистической " собаки.

Причем в книге Аптона разжевано, и как доверительные интервалы для оценок получать, и что делать, если хи-квадрат мера почему-то не устраивает. И даже, если бы вдруг кто-то заинтересовался не просто вопросом локализации поражения, а такой экзотикой, как высота места поражения относительно земли (я понимаю, что экстравагантно, но все-же) , т.е. захотел бы анализировать не номинальный, а порядковый признак, и то ответ можно найти в указанной книге. О чем вообще спор??? О каком "прорыве" вы говорите?? Разве что элементарная подсказка ТС, где взять давно известное решение ее задач и на какой авторитет ссылаться, если что.

2. Поясните пожалуйста, откуда у Вас взялась цифра 77, когда автор пишет:
Цитата(Елена Гогуа @ 6.05.2018 - 17:34) *
У меня всего 88 собак
  Форум: Медицинская статистика · Просмотр сообщения: #22975 · Ответов: 30 · Просмотров: 1227

passant
Отправлено: 9.05.2018 - 00:18


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(nokh @ 8.05.2018 - 23:32) *
>passant. Таблица сложнее, упрощать не нужно: 8 пород х 5 локализаций х 4 типа поражения (отсутствует, грибковое, бактериальное, комбинированное). Т.е. входов три. Статистика хи-квадрат неаддитивна, точно на эффекты не разложить, поэтому только логлинейный анализ. Поскольку таблица получается наполовину пустой (77/160=0,48) анализировать исходную - плохая затея.

Немного не так.
8 пород. 5 локализаций.
От типа поражения ТС отказалась.
Цитата(Елена Гогуа @ 8.05.2018 - 18:51) *
Поскольку исследовательский вопрос - локализация, а не тип воспаления, логично объединить их в группы: воспаление ушей, лап и т.д. Но поскольку уши с лапами никак не связаны...... они все равно должны оцениваться отдельно друг от друга, но во взаимосвязи с породой:

Итого в таблице 40 клеток.
У ТС 88 случаев (собачек) , т.е. не такая уж и пустая таблица получается. (88/40=2). Хотя очевидно, что несбалансирована, т.к. такс, например, всего 5 случаев (а хотелось бы ближе к 11).
На эффекты разлагать (см. вышеприведенную цитату) ТС целью как бы не ставит. Равно, как и поиск взаимосвязей между различными локализациями. (Впрочем, тут я допускаю, что мог чего-то не уловить). Так что пока - вполне классическая задача, а если количество "пациентов" увеличить - то и вообще, готов взять в качестве примера для студентов, хотя и не по профилю smile.gif .
  Форум: Медицинская статистика · Просмотр сообщения: #22971 · Ответов: 30 · Просмотров: 1227

passant
Отправлено: 8.05.2018 - 22:01


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Уважаемая Елена.

Не будучи ни врачом, ни тем более ветеринаром smile.gif , каждый раз удивляюсь, как вы, медики, умеете все уcусложнять и нагорамождать кучу всего там, где технарь исходно будет пытаться все разложить по полочкам. smile.gif
Давайте пройдемся по вашей задаче еще раз. Итак, цель вашего исследования - доказать, что локализация (уши, лапы, хвост) поражения связана с породой. И ничего больше - вы не хотите обучать машину распознавать породу по месту раны, вы не хотите предсказывать место локализации по породе, не хотите выявлять зависимость поражения лап от поражения головы. Ничего такого заумно-сложного. Всего лишь ответить на вопрос, зависит ли дислокация раны от породы.
Что для этого надо. Да всего-лишь составить таблицу. По строкам - породы, по столбцам дислокация. (Какие 40 таблиц???? Одна единственная таблица!!!). На пересечении - количество обнаруженных случаев данной локализации у собак данной породы. Потом берем конкретную породу (строчку в таблице), строим еще одну "виртуальную" строчку, куда заносим сумму случаев каждой локализации для всех оставшихся пород. Теперь вам надо ответить на вопрос, который математически звучит так: выборки представителей "вашей породы" и "всех других пород" взяты из одной и той-же генеральной совокупности случаев (гипотеза H0) или из разных (альтернативная гипотеза H1). Причем на сколько я понял, у вас задача еще проще, и заключается в том, что вы ищете ответы на вопросы типа "повреждения хвоста у терьера встречается так же часто, как у всех собак (гипотеза H0)". Понятие "контрольная группа" тут бессмысленна, вернее "контрольная группа" - это все собаки других пород (та самая виртуальная строчка).
Если надо доказать статистическое значимое различие локализаций между представителями разных но конкретных пород, то "виртуальную" строчку делать не надо, надо просто из таблицы вырезать две строчки, соответствующие тем породам, которые вас интересуют и решать описанную задачу относительно них.
Если подумать, то ваша задача ничем не отличается от такой задачи, как например, выяснить, женщины чаще болеют болезнью "Х", чем мужчины или нет. Или "голубой цвет глаз встречается одинаково часто у представителей белой, желтой и черной рас или нет".
Задача статистически тривиальна, другое дело что 3 (три!!!!) представителя породы, это конечно очень мало для сколько-нибудь значимых и обобщаемых результатов. И это, пожалуй, самый "пробойный" и труднозащищаемый пункт всего вашего исследования. (На что вам, кстати, уже неявно указали).
Теперь следующий вопрос. Откуда вдруг возникает "пара признаков". Опять-же если я правильно понял, то вы хотите установить, "а правда ли, что пинчеры чаще ОДНОВРЕМЕННО вредят себе усы и хвост чем собаки других пород"? Я не берусь комментировать, на сколько это осмысленный вопрос, но если это так, то самый простой путь - для каждой породы (строчки в вышеописанной таблице) вам надо добавить столбцы, в которые заносить количество тех самых одновременных локализаций. Все остальные рассуждения остаются теми-же.

Еще раз перечитав тему понял, что вы сами в сообщении http://forum.disser.ru/index.php?showtopic...amp;#entry22948 вобщем-то корректно ответили на свои вопросы. А потом - чего-то испугались? И напрасно! rolleyes.gif
Удачи!

P.S. Поправка Бонферрони - это не "другой метод". Это всего-лишь дополнение к методу основному. Всего-лишь способ ужесточения порога значимости.
  Форум: Медицинская статистика · Просмотр сообщения: #22966 · Ответов: 30 · Просмотров: 1227

passant
Отправлено: 6.04.2018 - 11:44


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


А можно пердварительно попросить Вас прояснить, что в? имеете ввиду, говоря:
Цитата(Cules2013 @ 5.04.2018 - 23:18) *
доверительные интервалы, рассчитанные для исходных данных по каждой из выборок,

Вообще-то во всех книгах по статистике написано, что "термин, используемый для интервальной оценки статистических параметров, . Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью". Другими словами доверительный интервал может быть только для некоторого параметра выборки, но никак не для "исходных данных выборки".
Вот сижу и думаю, что-же вы ввиду-то имели? wink.gif
  Форум: Медицинская статистика · Просмотр сообщения: #22870 · Ответов: 12 · Просмотров: 1219

passant
Отправлено: 4.04.2018 - 10:05


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Cules2013 @ 3.04.2018 - 16:19) *
Статистика - это не философия и не литературоведение, здесь должно быть всё чётко и понятно, а не "трактуй, как хочешь".

Вот тут вы ошибаетесь. В своей жизни я изучал одну единственную науку, в которой было все строго определено, выверено, безошибочно, четко и понятно - марксистско-ленинскую философию. Все остальные математики, физики, статистики, сопроматы, ТОЭ и прочие DataScience всегда строятся на огромном числе ограничений, допущений, предположений, трактовках, сомнений и пр.пр.пр smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #22862 · Ответов: 10 · Просмотров: 1256

passant
Отправлено: 3.04.2018 - 10:17


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Cules2013 @ 3.04.2018 - 07:40) *
Уже давно мучает меня вопрос о том, где бы найти достоверную инфу (а не кто-то где-то примерно что-то сказал на просторах сети) о том, какие требования и допущения к каждому конкретному стат. методу/критерию..............
.........если их количество не менее 3, но не более 6.............
Хотелось бы знать конкретно, "что, куда и как". А то в сети слышал мнения, что .................
Проблема же ещё и в том, что несоблюдение подобных требований, отнюдь не значит, что стат программа откажется вам делать анализ. Она, скорее всего, преспокойно вам выдаст какую-то ахинею, а вы и не будете знать и поверите ей "на слово" ..........


Вы на самом деле зацепили два разных вопроса.
Ну, во-первых, конкретных цифр, подобно приведенным примерам, вы не найдете нигде (по крайней мере - в серьезных работах, а наличие таких цифр - лишний повод усомниться). Там будут более опекаемые формулировки, что в общем - понятно и правильно. Статистика по сути своей пытается дискретное пространство описать непрерывными категориями. А в непрерывном мире точных границ не существует по определению. Просто все понимают, что когда говорят, что "функция стремиться к нулю при X стремящемуся к бесконечности", то это может в реальном мире означать, что при некоторых, достаточно больших X функция станет неотличима с заданной точностью от нуля. А вот что такое "достаточно большие" и что такое "неотличима с заданной точностью" - при этом выносится за скобки. Так что, как правило, "что применимо при x=3, применимо и при x=4".
Во-вторых, вопрос касается того, а какие ограничения действительно существуют, работают или являются плодом воображения "кого-то там в сети". И вот тут засада. Для того, что-бы это понять, надо самому углубляться и разбираться в каждом методе. Почему? Да потому, что "то что сказано в сети" и "то что написано в умных книжках" отличается только тиражом распространения и доступностью, но не степенью "умности" или "глупости"вещей, там изложенных. Другими словами, кто-то (пусть даже очень авторитетный с вашей точки зрения) на форуме сказал "А", а в книге (тоже не менее авторитетной) написано "Б". Кому верить? Только прочитав и самому разобравшись можно "примкнуть к одному из лагерей". А часто и лагерей больше двух. Но заметьте, никто не даст гарантии, что ваша позиция действительно истинна. Ну, разве что Вы вступите в прямой контакт с Богом, да и то - не факт, что он хорошо разбирается в статистике :-).
Единственное, что можно и нужно сделать - помимо того, что самому разобраться в любом применяемом вами методе - это составить себе на каждый случай перечень всех понятых и принятых ЛИЧНО ВАМИ условий и ограничений, понимать как и не забывать их применять ВСЕГДА, когда вы используете этот метод . И еще - не менее важно - всегда уметь объяснить и обосновать то самое ваше личное мнение (а не просто сослаться на чей-то авторитет). Прислушаться к его критике и во время его изменять, если найдете критику основательной. И не отстаивать свое мнение только потому, что вы его высказали - это свойство исследователя я вообще выношу за скобки (и ставлю на первое, а вернее - нулевое место).
Так что вперед. Нужны ответы - не ждите готовых, а разбирайтесь и анализируйте их сами.
"Все сказанное выше является моим личным мнением, существующим на данный момент, может быть подвержено критике всех желающих и может быть мной изменено без предварительного оповещения" (С) - smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #22856 · Ответов: 10 · Просмотров: 1256

passant
Отправлено: 27.03.2018 - 09:53


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(leo_biostat @ 26.03.2018 - 18:26) *
Поскольку очень часто все вопрошающие не очень ясно и понятно формулируют свои вопросы.

Если человек не может ясно и понятно сформулировать свой вопрос, то в 99% случаях это означает, что он и проблемы своей по сути не понимает. Может стоит в таких случаях начинать с того, что "вытягивать" его на корректную формулировку? Думаю, это будет и ему и многим будущим "новичкам" форума весьма полезно.

Цитата(leo_biostat @ 26.03.2018 - 18:26) *
И тогда желающий оказать Вам помощь вызовет Вас, и проведёт собеседование. Вот и получите эту помощь.

И тогда на форуме окончательно перестанут накапливаться ответы на вопросы и каждый новый "вопрошающий" вынужден будет решать свою проблему с нуля.
Как бы там ни было, сегодня если в Гугле забить определенные вопросы, кстати - даже по проблемам далеким от медицины, довольно часто мы попадаем на этот форум. Мне самому доводилось именно так несколько раз "переоткрывать" этот форум и выяснять для себя что-тот новое. И доводилось направлять людей, которые ко мне обращаются за консультациями по НЕмедицинским вопросам, к темам форума. Переход на приватные консультации в Скайп эту "фичу" убьет окончательно и бесповоротно.


Цитата(leo_biostat @ 26.03.2018 - 18:26) *
N.B.! Рекомендую Админам Форума дополнить это предложение по Скайпу в рекомендации общения по всем разделам Форума.

И превратить форму из платформы обмена знаниями в платформу поиска консультацийнтов. Впрочем - у каждого свои интересы.
  Форум: Медицинская статистика · Просмотр сообщения: #22808 · Ответов: 13 · Просмотров: 1709

passant
Отправлено: 25.03.2018 - 19:21


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Вообще-то, согласно классическому определению:
"Критерии однородности - это критерии проверки гипотез о том, что две (или более) выборки взяты из одного распределения вероятностей"
Поэтому, действительно, загадка, что имелось ввиду, когда говорилось " Как .... проверить что выборка (в единственном числе !!!!) в группе 1 однородная" (За одно, можно и поинтересоваться, почему стоит вопрос про группу #1, а про группу #2 не говориться ничего)
Но нам тут не привыкать к "точным" форулировкам sad.gif . Можно, как обычно, попробовать угадать wink.gif , что в данном случае автор имел ввиду "равномерность распределения значений выборки". И если это так - то напомнить автору, что для этой задачи есть критерий Шермана, критерий Морана, и далее по списку (см. например, справочник Кобзаря).
Впрочем, исходя из того, что надо "проверить как различаются группы по ряду параметров" может я и не угадал wink.gif. Ну, тогда надо все-таки "дожать" автора на корректное изложение задачи.
  Форум: Медицинская статистика · Просмотр сообщения: #22803 · Ответов: 13 · Просмотров: 1709

passant
Отправлено: 9.03.2018 - 18:46


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Осмелюсь дать ссылочку на блог нашего уважаемого коллеги по форуму.
http://biostat-r.blogspot.com/2015/03/trialsize.html
Хоть ссылка явно с медицинским уклоном, но информацию по математике метода, который независим от прикладной области, там найти можно. Ну и ссылочка для дальнейшего углубления в тему при необходимости - тоже есть.
  Форум: Медицинская статистика · Просмотр сообщения: #22752 · Ответов: 2 · Просмотров: 922

passant
Отправлено: 9.03.2018 - 18:17


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(nastushka @ 9.03.2018 - 14:08) *
Я вроде нашла
это sparse matrix, я это имела ввиду
https://stackoverflow.com/questions/1200907...e-sparse-matrix

А какое это имеет отношение к "тесту на то, является-ли матрица действительно разряженной" ?
В ссылке явно сказано "it seems it doesn't work on sparse matrix." Т.е. оказывается, что некоторый конкретный метод не работает (а по сути, это означает, как привило, что метод что-то там считает, но то-ли результат неточен или вообще расходится, то-ли алгоритм работает слишком медленно или вообще зацикливается - никто не знает, что означает "не работает") если в матрице "очень много" пустых (или нулевых) клеток. При этом другие алгоритмы, разработанные специально для случаев, когда в матрице "преимущественно" пустые клетки - с задачей справляется. И только.
Ну, если очень нужен тест, возьмите свои данные, прогоните через этот алгоритм, если он "не сработает" - можете смело считать, что тест "на разряженность матрицы" успешно пройден.
  Форум: Медицинская статистика · Просмотр сообщения: #22751 · Ответов: 3 · Просмотров: 599

passant
Отправлено: 8.03.2018 - 16:36


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(nastushka @ 8.03.2018 - 14:38) *
Подскажите, есть ли статистический тест, который поможет проверить, что матрица данных данных действительно разряжена?

Сначала дайте СТРОГОЕ определение, что такое разряженная матрица smile.gif . Если ВДРУГ вам это удастся, то тогда без проблем окажется протестировать.
(Что бы было понятнее - взгляните на любое определение разряженности матрицы, начиная с Википедии. Наверняка там найдете слово "преимущественно" "очень велико", "на много больше" и т.д. И подумайте, можно-ли такое определение считать строгим и формальным.
И еще. Введение понятия "разряженная матрица" было вызвано попыткой оптимизировать вычислительные алгоритмы, а никак не собственно какими-то исключительными внутренними особенностями, присущими таким структурам)
  Форум: Медицинская статистика · Просмотр сообщения: #22744 · Ответов: 3 · Просмотров: 599

passant
Отправлено: 3.03.2018 - 16:18


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Думаю, для тех, кто решил ознакомиться с R - будет весьма полезна.
А для тех, кто уже знаком - хорошим справочником-напоминалкой.
http://books.goalkicker.com/RBook/
И - главное - официально свободно распространяемое издание "Please feel free to share this PDF with anyone for free"
  Форум: Медицинская статистика · Просмотр сообщения: #22715 · Ответов: 0 · Просмотров: 770

passant
Отправлено: 26.02.2018 - 17:26


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(DrgLena @ 26.02.2018 - 00:47) *
Я думаю, что вы не правильно поняли. Баллов после операции нет. Обе оценки сделаны до операции. Вторая оценка характеризует больного после какого то времени ОЖИДАНИЯ операции. И это написано ясно.

Да, Вы правы. Перечитал еще раз - именно так. Просто мне, как "не врачу", сложно было представить, что можно откладывать необходимую операцию просто для того, что-бы доказать гипотезу, что "чем больше ждем, тем хуже становиться больному".
  Форум: Медицинская статистика · Просмотр сообщения: #22686 · Ответов: 12 · Просмотров: 1147

passant
Отправлено: 26.02.2018 - 17:20


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Daria @ 26.02.2018 - 09:31) *
"..."линейная кривая" и как вы ее себе представляете - это загадка"
Да, я неверно выразилась. Но смысл, думаю, понятен. Графическое преставление линейной зависимости, наверное, так.

"линейная кривая"=="Графическое преставление линейной зависимости" == (самое сложнонаучное и математикозаумное название) "прямая" lol.gif (ну,
или "плоскость" в многомерном случае).
  Форум: Медицинская статистика · Просмотр сообщения: #22685 · Ответов: 12 · Просмотров: 1147

passant
Отправлено: 26.02.2018 - 00:49


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Начнем с представления данных. Если я правильно понял, и ДЛЯ КАЖДОГО БОЛЬНОГО у вас есть информация по состоянию до и после операции, то на самом деле ваши данные немного другие. А именно, представьте, что у вас есть таблица со следующими столбцами:
Пациент (id), Баллы по шкале до операции (БДО), Время ожидания операции (ВО), Баллы по шкале после операции (БПО).
Вот теперь можно и корреляцией заняться, например выяснить, коррелированы-ли БПО и БДО. БПО и ВО. И да, нужно применять двухвыборочные методы для зависимых выборок. Можно попытаться применить и множественную корреляцию. Главное помните, что БПО и БДО у вас измерены в ранговых шкалах, а ВО - в количественной, и методы надо выбирать соответствующие.
Дальше можно попробовать построить модель зависимости БПО от БДО и ВО. Правада, что такое "линейная кривая" rolleyes.gif и как вы ее себе представляете - это загадка. А поскольку Ваши БПО и БДО представлены в ранговых шкалах (это насколько я понял), то строго говоря вы должны строить не регрессионную, а классификационную модель. Каким методом - тут конечно надо немного подумать, но ваша задача вполне классическая и описана почти дословно во многих книгах по мед.статистике.
"Регрессионная модель с фиксированными и случайными эффектами" - с моей точки зрения, это вас уже занесло как-то очень далеко не туда.
"можно реализовать и в SPSS, и в Stata", - Можно. Можно и в R, и в Python, и даже в EXCEL. Реализовывайте в том, что вы лично лучше знаете.
  Форум: Медицинская статистика · Просмотр сообщения: #22679 · Ответов: 12 · Просмотров: 1147

passant
Отправлено: 22.02.2018 - 15:33


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(nastushka @ 22.02.2018 - 14:04) *
Подскажите, как можно решить такую задачу
1. есть данные, в них 20 переменных
2. нужно кластеризовать эти 20 переменных, т.е. выделить классы схожим переменных
3.затем найти людей, которые "кучкуются" у каждого класса переменных.
Например мы нашли 4 класса переменных абв, где, ежз, икл. наблюдения 1-30 кучкуются у класса к примеру ежз.

Что-то у вас все в кучу, мухи, котлеты, переменные, наблюдения, кластеры, классы, "кучки".... sorry.gif
Во-первых. Что такое "классы схожих переменных"? Вы имеете ввиду, что некоторые переменные у вас зависимые (коррелированны) между собой? И вы хотите из группы сильно коррелированных переменных оставить только одну? В любом случае, "классами" эти переменные я бы называть поостергся, а уж тем более их "кластеризовать"
Во-вторых. Что значит "кучкуются у каждого класса переменных"??? unknw.gif Тут у меня даже фантазии не хватает понять, что вы имеете ввиду.
В любом случае, рекомендую сначала прочитать хотя-бы краткое введение в кластерный анализ. Может - поймете сами чего нужно, но по крайней мере - сумеете хоть внятно объяснить свою задачу в общеупотребимых терминах
Или второе возможное действие - описать вашу прикладную задачу, и дать возможность специалистам самим разобраться кого и куда "кластеризовать" smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #22662 · Ответов: 9 · Просмотров: 1140

passant
Отправлено: 16.02.2018 - 21:00


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(med-ick @ 16.02.2018 - 17:09) *
Несмотря на то, что в медицине методы data mining не используются,


Очень сильно надеюсь, что Вы просто прикалываетесь.
Верю, что любой мало-мальский специалист (и в медицине в том числе) понимает, где, как и для чего в его области знаний могут и -главное(!!!!) --- уже применяют методы анализа данных, ИИ, нейронные сети и пр.
Иначе - можно остаться без работы wink.gif :
Вот, уже началось : http://ai-news.ru/2017/11/kitajskij_ii_pol...ziu_vracha.html
http://ai-news.ru/2017/12/iskusstvennyj_in...chej_trend.html

Ну, а если серьезно, и Вы почему-то проспали, что делается в этом направлении в мире - то кратенькая подборка с лёту, так сказать для входа в тему:
https://towardsdatascience.com/deep-learnin...is-c04d35fc2830
https://habrahabr.ru/company/mailru/blog/325908/
https://www.kdnuggets.com/2017/04/medical-i...ing-part-2.html
https://www.cio.com/article/3235445/healthc...healthcare.html
https://stanfordmlgroup.github.io/projects/ecg/
https://tensorflow.rstudio.com/blog/dl-for-...unotherapy.html
https://nplus1.ru/material/2017/01/20/smart-medicine
https://nplus1.ru/news/2018/02/08/apple-watch-diabetes
Совсем свеженькое
https://geektimes.ru/post/298187/
и классика жанра
https://www.ibm.com/watson/health/
и так далее.........

А вообще-то, наверное Вы правы. Постоянно сталкиваюсь с тем, что уровень даже не столько знаний наших врачей, но уровень их желания даже разобраться в этом вопросе, просто почитать что и как - как-бы это сказать помягче, что-бы никого не обидеть - примерно никакой. Приходишь, предлагаешь, говоришь - давайте попробуем, давайте сделаем хоть малюсенький шаг -- а в ответ тишина (в лучшем случае) или полуагрессивное отторжение. А жаль. sad.gif Я все понимаю, вам людей каждый день лечить, с того света часто вытягивать, Я восхищаюсь и преклоняюсь за это перед медиками. Понимаю, что вам часто не до траты времени на всякие заумные новшества. Но.... Грустно.
  Форум: Медицинская статистика · Просмотр сообщения: #22644 · Ответов: 3 · Просмотров: 542

passant
Отправлено: 15.02.2018 - 13:00


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(DrgLena @ 15.02.2018 - 00:00) *
Предлагаю окончить столь содержательную дискуссию о рандомизации, меланхолия ваша, видимо, заразная.

Пересмотрел еще раз тему. Имеем: 24 СЛУЧАЙНО ОТОБРАННЫХ пациентов требуется разбить на две группы СЛУЧАЙНЫМ образом. Всего-то!. И уж сюда и Statistica, и R, и EXCEL в ход пошли. И строго наукообразные методы рандомизаци. Не хватает только Hadoop, Watson и Blockchain. smile.gif . А делов-то - на 24 бумажках написать фамилии (или номера),перемешать и вытянуть из шапки случайным образом. Между прочим, теоретически - действительно, самое "случайное" из возможных решений. Но нет, свирепый высоконаучный совет-редакция не пропустит. smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #22634 · Ответов: 35 · Просмотров: 6514

passant
Отправлено: 12.02.2018 - 17:11


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 12.02.2018 - 16:55) *
Особенно интересует формула пересчета действительного числа из [0;1] в целый индекс от 1 до 24.

Ну, этого, как раз при предлагаемой методике делать и не надо. Да и не сложно это, кстати. По-крайней мере в этом я за своих студентов спокоен (у меня - ИТ-шники, если что)smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #22614 · Ответов: 35 · Просмотров: 6514

passant
Отправлено: 12.02.2018 - 16:39


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(nokh @ 11.02.2018 - 16:02) *
У меня есть заготовка с ответом из выходящего в этом году Лабораторного практикума по биостатистике, но только в Excel - прикрепил.

Посмотрел Ваш файл. Как мне кажется, для корректной работы там пропущен один пункт. Между п.3 и п.4. надо вставить превращение динамически генерируемых чисел в статические значения, т.е. выделить оба столбца, выбрать "копировать", потом выбрать"Главная"-> "Вставка"->""специальная вставка" -> "значения"-> OК.
По крайней мере, в последних версиях EXCEL (2007 и выше) так. Иначе, он делает перегенерацию случайных чисел прямо в процессе сортировки.
Второй путь - отключать в настойках EXCEL автоматический пересчет формул, но это уже извращение.
Зная подходы к учебе у студентов, я бы все-таки это вписал в методичку, а то задерут вопросами :-)
  Форум: Медицинская статистика · Просмотр сообщения: #22612 · Ответов: 35 · Просмотров: 6514

passant
Отправлено: 11.02.2018 - 14:31


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Вообще-то на картинке мы видим совершенно классический случай, который рассматривается на первых страницах любого учебника или сайта по временным рядам. (Например http://statsoft.ru/home/textbook/modules/sttimser.html). Ряды такого типа особенно характерны для эконометрических задач, где и исследуются весьма подробно. (Например - http://eos.ibi.spb.ru/umk/4_5/5/print/5_R1_T6.pdf , http://baguzin.ru/wp/4-3-prognozirovanie-i...nirovanie-v-ra/ ). Называются они - рядами с сезонной составляющей (слово "сезонный" не должно смущать, в данном случае период сезонности может быть и несколько секунд, и неделя, и год, и тысячелетие). Для таких рядов придуманы специальные методы - и для формального обнаружения сезонности и выявления их отличий от просто хаотических колебаний, и для выявления периода сезонности (опят-же, не на глаз, а формально), причем в одном ряду могут быть несколько различных сезонных составляющих, и для прогнозирования поведения ряда, в модели которого присутствуют сезонные компоненты и даже для обнаружения аномалий сезонности.
Естественно и в R доступны средства для работы с сезонностью, например:
http://a-little-book-of-r-for-time-series....timeseries.html
https://shiring.github.io/forecasting/2017/...orcasting_part3
https://petolau.github.io/Regression-trees-...me-series-in-R/
и много много других.
Поэтому, думаю, если автору действительно хочется сделать серьезную работу, а не строить свой велосипед, следует ознакомиться с упомянутым подходом. А если это просто "проходная" задача - то можно, конечно, и "на глазок".
  Форум: Медицинская статистика · Просмотр сообщения: #22599 · Ответов: 22 · Просмотров: 2262

passant
Отправлено: 10.02.2018 - 22:01


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


Не хотите Вы слушать, что Вам говорят.
Ну тогда взгляните на Рис1. (Правда, я тут намедни инсталлировал новую для себя версию EXCEL и мне было интересно за одно поиграться с ней. Так что не на R, уж не обессудте.)
Вы еще хотите после этого применять чисто линейную регрессионную модель? Ну пожалуйста.
EXCEL в два клика дает значения коэффициентов линейной регрессии (Рис.2).
Получаем, подставляем, строим график (Рис.3). Желтая - регрессия внутри имеющейся серии, красное - прогноз.
Ну уверен, что такой прогноз хоть в чем-то может оказаться полезен, хотя.....
Эскизы прикрепленных изображений
Прикрепленное изображение
Прикрепленное изображение
Прикрепленное изображение
 
  Форум: Медицинская статистика · Просмотр сообщения: #22594 · Ответов: 22 · Просмотров: 2262

passant
Отправлено: 10.02.2018 - 14:03


Дух форума
*

Группа: Пользователи
Сообщений: 108
Регистрация: 27.04.2016
Пользователь №: 28223


ЕСЛИ ((Вы уверены, что у вас линейная регрессионная модель может что-то предсказать на период 14 дней) И (у Вас действительно ежедневные данные за предыдущий период))
ТО
использование специализированных средств работы с временными рядами Вам не нужно.

Все что Вам надо:
1. Создаете фрейм:
- первый столбец - номер дня (именно так - первый день наблюдения -1, второй день наблюдения - 2...... последний день наблюдения - (например)20).
- второй столбец - значения наблюдения в соответствующий день.
2. Скармливаете эти данные функции lm(с2~c1,...). Получаете модель.
3. Подставляете дни, на которые вам надо сделать прогноз - в нашем примере - 21,22,.....34 (если надо на две недели вперед).
4.ЕСЛИ у Вас не нарушены основные предположения (т.е. модель действительно имеет линейные тренд, И он сохраняется на весь период прогнозирования)
ТО наслаждаетесь результатами;
ИНАЧЕ
Применяете другие подходы;
  Форум: Медицинская статистика · Просмотр сообщения: #22591 · Ответов: 22 · Просмотров: 2262

5 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена