Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

43 страниц V   1 2 3 > » 

p2004r
Отправлено: 4.03.2020 - 23:22


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(p2004r @ 27.02.2020 - 14:31) *
https://invisioncommunity.com/forums/topic/...-elasticsearch/

Как бы снабдить каждую открытую тему блоком верстки (например в самый низ страницы вынесенном), где автоматом показаны топ-10 самых релевантных остальных тем из истории форума в которых обсуждается та же самая тема, что и поднятая в данной открытой теме?

PS

ну и проиндексировать в Elasticsearch всю историю форума естественно под это дело smile.gif



Версия 4.3+ поддерживает нормальный поиск.

https://invisioncommunity.com/news/product-...ovements-r1062/

Elasticsearch
In Invision Community 4.3 we are adding native support for Elasticsearch, a third party search engine which offers a number of benefits over searching your MySQL database:

Elasticsearch, being designed and indexing data in a way optimised for search rather than data storage, is generally able to match and sort by relevancy with better accuracy than MySQL.
Elasticsearch is generally faster. One user performing a search doesn't slow down other users trying to read and make posts at the same time (when searching MySQL, the data has to be "locked" from changes when the search is being performed). It scales very well with very large datasets, and runs very easily on multiple servers.
Elasticsearch understands language. If for example, you search for "community", it will also return results which contain the word "communities", understanding that these are the same. Supported languages are Arabic, Armenian, Basque, Brazilian, Bulgarian, Catalan, Chinese, Czech, Danish, Dutch, English, Dinnish, Drench, Galician, German, Greek, Hindi, Hungarian, Indonesian, Irish, Italian, Japanese, Korean, Latvian, Lithuanian, Norwegian, Persian, Portuguese, Romanian, Russian, Sorani, Spanish, Swedish, Turkish, Thai.
Elasticsearch supports custom functions on the scoring algorithm. In our initial implementation this has allowed us to add settings to allow you to control the time decay (allowing newer results to show higher) and author boost (allowing content posted by the user to optionally show higher in results).
Unlike with MySQL, there is no minimum query length and a very small list of stop words.


  Форум: Разное · Просмотр сообщения: #25405 · Ответов: 2 · Просмотров: 201

p2004r
Отправлено: 27.02.2020 - 14:31


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


https://invisioncommunity.com/forums/topic/...-elasticsearch/

Как бы снабдить каждую открытую тему блоком верстки (например в самый низ страницы вынесенном), где автоматом показаны топ-10 самых релевантных остальных тем из истории форума в которых обсуждается та же самая тема, что и поднятая в данной открытой теме?

PS

ну и проиндексировать в Elasticsearch всю историю форума естественно под это дело smile.gif

Вот как то в духе этого руководства https://qbox.io/blog/practical-guide-elasti...oring-relevancy
  Форум: Разное · Просмотр сообщения: #25390 · Ответов: 2 · Просмотров: 201

p2004r
Отправлено: 23.02.2020 - 13:03


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(Felix77 @ 23.02.2020 - 11:36) *
Коэффициенты корреляций между предикторами слабые - 0.14-0.36. И с чего вдруг мультиколлинеарность больше чем допустимо.
Не понимаю!



Код
> car::vif(modkim)
         Анемия Объем.контраста         возраст
       5.584514        5.157870        1.400406


Generally, VIF for an X variable should be less than 4 in order to be accepted as not causing multi-collinearity. The cutoff is kept as low as 2, if you want to be strict about your X variables.


ЗЫ

Код
> glm(КИН ~ Объем.контраста + возраст , kinm, family=binomial(link="logit"))

Call:  glm(formula = КИН ~ Объем.контраста + возраст,
    family = binomial(link = "logit"), data = kinm)

Coefficients:
    (Intercept)  Объем.контраста          возраст  
      -16.17699          4.67647          0.07174  

Degrees of Freedom: 300 Total (i.e. Null);  298 Residual
Null Deviance:        220.4
Residual Deviance: 60.04     AIC: 66.04
> car::vif(glm(КИН ~ Объем.контраста + возраст , kinm, family=binomial(link="logit")))
Объем.контраста         возраст
       1.014424        1.014424
  Форум: Медицинская статистика · Просмотр сообщения: #25373 · Ответов: 8 · Просмотров: 300

p2004r
Отправлено: 23.02.2020 - 10:39


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(Felix77 @ 23.02.2020 - 09:34) *
Доброго времени суток!
Модель вроде бы адекватная (зависимая переменная - КИН), 3 предиктора - объем контраста, возраст, анемия (есть или нет). Но вот отношения шансов получаются какие-то очень высокие.
Intercept) Анемия1 возраст Объем.контраста
4.991232e-15 4.267894e+03 1.167138e+00 2.609896e+03



1. У вас разделены данные по КИН без всяких моделей и сомнений. "Просто глазами" разделяемы.

2. Предикторы мультиколлинеарны более чем допустимо, значит значения коэффициентов модели содержательно интерпретировать нельзя. Но судя по п.1 сильно не уменьшиться.

Цитата(Felix77 @ 23.02.2020 - 10:15) *
А что не так то?



Ага
  Форум: Медицинская статистика · Просмотр сообщения: #25371 · Ответов: 8 · Просмотров: 300

p2004r
Отправлено: 23.02.2020 - 10:09


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(Felix77 @ 23.02.2020 - 09:37) *
[attachment=1880:Регрессия.xlsx]
Данные здесь


Внимательнее данные готовьте, тут шутников и так хоть ртом ешь.
  Форум: Медицинская статистика · Просмотр сообщения: #25368 · Ответов: 8 · Просмотров: 300

p2004r
Отправлено: 23.01.2020 - 17:09


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Зайдите на https://cran.r-project.org/view=Cluster и почитайте подраздел Model-Based Clustering.
  Форум: Медицинская статистика · Просмотр сообщения: #25177 · Ответов: 13 · Просмотров: 594

p2004r
Отправлено: 9.12.2019 - 18:49


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(md416 @ 8.12.2019 - 22:32) *
Подскажите пожалуйста, где можно почитать про выбор оптимальной точки отсечения?
Когда мне на пальцах объясняли эту тему, у меня отложилось, что точка отсечения - это где Sp=Se,то есть их пересечение. Но оказалось, что есть ещё десяток методов... в.т.ч критерий Юдена.
Есть ли какой-то критерий для сравнения данных данных подходов?


Если известна ожидаемая частота детектируемых методом случаев и соотношение цены ошибок первого и второго рода, то решение просто получается по формуле Youden в модификации Perkins и Schisterman. В том числе и предельные случаи: "детектировать все подряд" и "ни на что не реагировать, дешевле будет".
  Форум: Медицинская статистика · Просмотр сообщения: #24872 · Ответов: 54 · Просмотров: 114801

p2004r
Отправлено: 26.11.2019 - 09:53


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Тут принципиальный вопрос.

1) Или мы проверяем факт, что средние двух выборок отличаются друг от друга на 200 мл и более (настраивая условия теста p-value "он может заметить и не пропустить только 200 и более" и говоря тест прошел, значит ОК)

2) Или мы говорим "в доверительный интервал при средней выборки с кровопотерей не попадает фиксированная граница кровопотери 200 мл". При этом придумывая что матожидание в экспериментальной выборке равно 200+"конкретная дельта".

Во втором случае можно и 50 человек смоделировать и 150. Все зависит как близко мы ожидаем среднее значение в эксперименте к границе при данной сигме. Для случая "среднее равно или больше заданной границы" мы ничего корректно ответить не можем из самой постановки, размер группы будет "уходить в бесконечность".

Думаю p-value тест именно такую постановку и призван разрешать, а в конкретном случае надо просто понизить ошибки первого и второго рода (то есть фактически повысить качество исследования) задав размеры групп достаточные для подтверждения гипотезы о распределении данных.

PS

Если распределение окажется не приводимом к нормальному, то останется возможность посчитать распределение средних в группах бутсрепом и сравнить с границей 200 мл перцентили этих распределений.
  Форум: Медицинская статистика · Просмотр сообщения: #24824 · Ответов: 8 · Просмотров: 1959

p2004r
Отправлено: 20.11.2019 - 13:29


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Код
> quantile(replicate(100000, mean(rnorm(3, mean = 400, sd = 50)) - mean(rnorm(3, mean = 400+200, sd = 50))), probs=c(0.025,0.5,0.975))
     2.5%       50%     97.5%
-279.7164 -199.9725 -120.1604
> quantile(replicate(100000, mean(rnorm(3, mean = 400, sd = 50)) - mean(rnorm(3, mean = 400+200, sd = 50))), probs=c(0.025,0.5,0.975))
     2.5%       50%     97.5%
-279.9967 -200.1365 -120.2151
> quantile(replicate(100000, mean(rnorm(2, mean = 400, sd = 50)) - mean(rnorm(2, mean = 400+200, sd = 50))), probs=c(0.025,0.5,0.975))
     2.5%       50%     97.5%
-297.6608 -199.9111 -102.1518
> quantile(replicate(100000, mean(rnorm(2, mean = 400, sd = 50)) - mean(rnorm(2, mean = 400+200, sd = 50))), probs=c(0.025,0.5,0.975))
     2.5%       50%     97.5%
-298.6200 -200.1311 -101.9544


Код
> table(replicate(1000000, mean(rnorm(3, mean = 400, sd = 50)) - mean(rnorm(3, mean = 400+200, sd = 50)))>0 )

  FALSE
1000000
> table(replicate(1000000, mean(rnorm(3, mean = 400, sd = 50)) - mean(rnorm(3, mean = 400+200, sd = 50)))>0 )

  FALSE
1000000
> table(replicate(1000000, mean(rnorm(3, mean = 400, sd = 50)) - mean(rnorm(3, mean = 400+200, sd = 50)))>0 )

FALSE   TRUE
999999      1
> table(replicate(1000000, mean(rnorm(2, mean = 400, sd = 50)) - mean(rnorm(2, mean = 400+200, sd = 50)))>0 )

FALSE   TRUE
999975     25
> table(replicate(1000000, mean(rnorm(2, mean = 400, sd = 50)) - mean(rnorm(2, mean = 400+200, sd = 50)))>0 )

FALSE   TRUE
999961     39
> table(replicate(1000000, mean(rnorm(2, mean = 400, sd = 50)) - mean(rnorm(2, mean = 400+200, sd = 50)))>0 )

FALSE   TRUE
999981     19
> table(replicate(10000000, mean(rnorm(3, mean = 400, sd = 50)) - mean(rnorm(3, mean = 400+200, sd = 50)))>0 )

  FALSE    TRUE
9999994       6


четыре сигмы, это четыре сигмы (лучше только пять smile.gif )
  Форум: Медицинская статистика · Просмотр сообщения: #24813 · Ответов: 8 · Просмотров: 1959

p2004r
Отправлено: 15.11.2019 - 21:22


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(nzbr @ 15.11.2019 - 14:53) *
Для выявления различия кровопотери в 200 мл на 5% уровне значимости с 80% мощностью, принимая стандартное отклонение равным 50 мл, потребуется 3 человек в группу вмешательства и контроля.


sd (как и доказательство что у нас вообще стьюдент в качестве распределения) надо получить, в виде доверительного интервала на выборке, из той же генсовокупности на которой будет основной эксперимент. Берем верхнюю границу, и по ней считаем, тогда действительно можно различить (как наименьший) выбранный размер эффекта с заданными ошибками первого и второго рода. Даже на таких малых группах.

Наверное надо брать большой контроль и на нем доказывать наличие предполагаемого распределения и вычислять доверительный интервал для sd. А эксперимент может быть хоть одиночное значение, но которое выйдет за 3-4 сигмы доверительного интервала для контроля.

Клинически значимая величина это обычно то, что без сомнения "глазом видно", поэтому и дает оценку что трех случаев достаточно. Вообще 200 мл кровопотеря на фоне 500 мл дающих вполне возможно коллапс гемодинамики, это очень много для эффекта, который надо искать по срабатыванию настроенного p-value теста.
  Форум: Медицинская статистика · Просмотр сообщения: #24798 · Ответов: 8 · Просмотров: 1959

p2004r
Отправлено: 15.11.2019 - 02:02


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(nzbr @ 14.11.2019 - 16:44) *
Здравствуйте!

При расчете размера выборки возникли сложности.

Мы считаем, что клинически значимая разница в кровопотере составляет 200 мл (получается delta = 200 ?)
Стандартное отклонение составляет 40.

Формула R:

power.t.test(delta = 200,
sd = 50,
sig.level = 0.05,
power = .90)

Результат:

Two-sample t test power calculation

n = 2.726721
delta = 200
sd = 50
sig.level = 0.05
power = 0.9
alternative = two.sided

Выходит, что в каждой группе может быть по 3 человека? Ведь в таком случае будет страдать репрезентативность. Прошу помочь разобраться.


Размер эффекта больше единицы, скажите спасибо что нафиг не послала как другие калькуляторы с такими запросами. Доверительный интервал фактически 4-е сигмы.

PS

А с репрезентативностью всё будет хорошо, что бы получить оценку гарантирующую sd в генсовокупности минимум заявленной величины, группы будут достаточно большие.
  Форум: Медицинская статистика · Просмотр сообщения: #24794 · Ответов: 8 · Просмотров: 1959

p2004r
Отправлено: 8.09.2019 - 19:17


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(p2004r @ 3.09.2019 - 21:22) *
А неплохо ("естественные группировки" он за корреляции не признает, что вполне даже логично и хорошо для разборок с ложными к.к.)


А вообще сосет sad.gif

> HellCor::HellCor(c(rnorm(100, mean=1), rnorm(100, mean=50)), c(rnorm(100, mean=1), rnorm(100, mean=50)) )
$Hcor
[1] 0.8612872

$pvalue
[1] NA


Вот это корреляцией не называется, это "ложный к.к. вызванный естественной группировкой в данных"
Эскизы прикрепленных изображений
Прикрепленное изображение
 
  Форум: Медицинская статистика · Просмотр сообщения: #24497 · Ответов: 25 · Просмотров: 18806

p2004r
Отправлено: 3.09.2019 - 21:22


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(ogurtsov @ 2.09.2019 - 19:12) *


А неплохо ("естественные группировки" он за корреляции не признает, что вполне даже логично и хорошо для разборок с ложными к.к.)


Эскизы прикрепленных изображений
Прикрепленное изображение
 
  Форум: Медицинская статистика · Просмотр сообщения: #24421 · Ответов: 25 · Просмотров: 18806

p2004r
Отправлено: 17.05.2019 - 12:07


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(nokh @ 17.05.2019 - 00:17) *
Провели анализ микробных ассоциаций в ожоговых ранах, выборка хорошая - более 400 проб. При оценке значимости ассоциаций с помощью индекса Жаккара в R-пакете jaccard выявилась такая штука: относительно большие индексы могли оказаться незначимыми (J=0.32; Р=0,504), а почти нулевые - значимыми (J=0.06; P=0.049). Если интересно - могу выложить данные, хотя я понял почему так происходит и сделал простой маленький пример. Стал искать другие пути, но не получается справиться самостоятельно. Буду очень признателен за помощь. Описание проблемы и вопросы в прикреплённом файле Help. Второй файл - статья, на которую есть надежда. Может ещё какие варианты подскажите...


Единственно разумный подход это (как и написано в обзоре литературы статьи) рандомизационный тест (или он + бутстреп доверительный интервал на сами частоты, что тоже там есть). Причина -- прямой подсчет частот не дает оценки мощности исследования и размера эффекта, что делает весь этот индекс практически эквивалентным "достигнутому p".

Это все о практически полезных конструктивных результатах которые можно извлечь из этой ситуации. (Ну а статью с "индексом своего имени" конечно не запрещено написать никому smile.gif ).
  Форум: Медицинская статистика · Просмотр сообщения: #23959 · Ответов: 13 · Просмотров: 2706

p2004r
Отправлено: 12.05.2019 - 22:10


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(nokh @ 12.05.2019 - 11:09) *
Большое спасибо, читал и подобное (и даже сам учил студентов:)). Но вот задумал интересную штуку и закрались сомнения, т.к. нужно чтобы было максимально корректно...


1) Если "читали и учили", то странные вопросы задаете. Но впрочем с удовольствием обсужу восстановление матриц описывающих динамическую систему со знающим человеком. smile.gif

"30 дней" это как? Сколько "замеров в день"? Если 1 и 1 пациент, то можно забыть о затее.

2) Что касается pdf с извращениями "здесь мы средние извлекаем и нормируем, а здесь как есть оставляем и все очень быстро в реалтайме делаем", то это увы "не о чём"ТМ. Скользящее среднее получается естественным образом из первых членов разложения матрицы Генкеля построенной по временному ряду (эти я баловался еще в 90е smile.gif, а оказывается "прозой говорил"(С) ). Не удивлюсь если одно через другое выразить можно.

Ну а варианты разложений PCA для тензоров "естественным образом" позволяют обрабатывать многомерные временные ряды.
  Форум: Медицинская статистика · Просмотр сообщения: #23949 · Ответов: 6 · Просмотров: 1808

p2004r
Отправлено: 12.05.2019 - 07:45


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(nokh @ 11.05.2019 - 22:05) *
Насколько корректно применять анализ главных компонент к временным рядам? Полазил по зарубежным форумам и увидел разные мнения. То, что так считают и есть много публикаций - факт, однако PCA основан на корреляциях, для которых требование независимости наблюдений в выборке нарушена. Хочу применить к медицинским данным: динамика изменения 5-7 показателей (температура, ЧСС, АД и др.) у отельного пациента в течение 30 дней после операции.



1) Математики десятилетиями раскладывают на собственные значения ( https://ru.wikipedia.org/wiki/%D0%A1%D0%BE%...%82%D0%BE%D1%80 и https://ru.wikipedia.org/wiki/%D0%A1%D0%B8%...%BD%D0%B8%D0%B5 ) матрицу имени Hankel ( https://ru.wikipedia.org/wiki/%D0%93%D0%B0%...%B8%D1%86%D0%B0 и https://en.wikipedia.org/wiki/Hankel_matrix).

Цитирую: "Hankel matrices are formed when, given a sequence of output data, a realization of an underlying state-space or hidden Markov model is desired. The singular value decomposition of the Hankel matrix provides a means of computing the A, B, and C matrices which define the state-space realization. The Hankel matrix formed from the signal has been found useful for decomposition of non-stationary signals and time-frequency representation."(С)

Ну и пример такой оценки в pdf.

2) PCA не основан на к.к., не читайте мурзилки где написана эта глупость. PCA это один из методов _тождественного_ _линейного_ преобразования системы координат в которых помещена конечная выборка. Почитайте хотя бы википедию:

"Метод главных компонент применим всегда. Распространённое утверждение о том, что он применим только к нормально распределённым данным (или для распределений, близких к нормальным) неверно: в исходной формулировке Пирсона ставится задача об аппроксимации конечного множества данных и отсутствует даже гипотеза о их статистическом порождении, не говоря уж о распределении."(С)




Прикрепленные файлы
Прикрепленный файл  TP3045.pdf ( 391,56 килобайт ) Кол-во скачиваний: 44
 
  Форум: Медицинская статистика · Просмотр сообщения: #23945 · Ответов: 6 · Просмотров: 1808

p2004r
Отправлено: 27.03.2019 - 09:18


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(nokh @ 26.03.2019 - 22:19) *
Это ggtern?


Да, это сырой бутстреп в ggtern.

PS чистая картинка вот так выглядит
Эскизы прикрепленных изображений
Прикрепленное изображение
 
  Форум: Медицинская статистика · Просмотр сообщения: #23850 · Ответов: 9 · Просмотров: 2256

p2004r
Отправлено: 26.03.2019 - 21:02


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Собственно эта конкретная задача решается вот так.

На графике синими линиями изображен the confidence intervals, default to 50, 90 and 95 percent.
Эскизы прикрепленных изображений
Прикрепленное изображение
 
  Форум: Медицинская статистика · Просмотр сообщения: #23847 · Ответов: 9 · Просмотров: 2256

p2004r
Отправлено: 18.02.2019 - 15:47


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(Med_Elena @ 18.02.2019 - 13:22) *
За прошедшие 2 года ВАК не утвердил диссертации 8 нашим аспирантам и 3 докторантам. Одна из причин этих отказов некорректные их результаты статистического анализа. Подскажите к кому мне рекомендовать наших аспирантов и докторантов за помощью в проведении статистического анализа. Хочу также знать и о том, кто из рекомендуемых может производить анализ больших баз данных (по несколько тысяч наблюдений и 2-3 сотни признаков) с помощью сложных многомерных методов. Поскольку ВАК утверждает все диссертации с такими результатами.


А что имеется в виду? Писать главу с анализом данных исследования "под ключ"?

И ещё тонкий момент, а кто планировал то само наблюдение-эксперимент? Бывает что уже поздно что то делать на этапе анализа sad.gif
  Форум: Медицинская статистика · Просмотр сообщения: #23744 · Ответов: 10 · Просмотров: 2963

p2004r
Отправлено: 11.02.2019 - 21:35


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


https://drive.google.com/file/d/1Pu1xFXp6K7...9VeB3YYiUW/view

Странно что они не учли в модели фактор "подопытный".
Прикрепленные файлы
Прикрепленный файл  GoBe_Validation_Report3.pdf ( 1,44 мегабайт ) Кол-во скачиваний: 80
 
  Форум: Медицинская статистика · Просмотр сообщения: #23732 · Ответов: 1 · Просмотров: 1229

p2004r
Отправлено: 7.02.2019 - 15:41


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(comisora @ 7.02.2019 - 13:37) *
Коллеги, доброго времени суток!

Даны ЮЛ "Рога" и "Копыта", которые предлагают наборы "комплексных решений". Сама суть решения содержится в договорах (персональный манагер, круглосуточная тех.поддержка, сопровождение документообороту по различным условиям и т.п.), некоторые пункты различаются при разных уровнях обслуживания (ВИП-клиентам кофе и шоколадку во время ожидания). Сами данные, понятно, разнородные - часть показателей счётные (количество оформленных бумажек и т.п.), часть - это некоторые условия в текстовой форме с "уникальными" предложениям. Спросили - как можно "объективно" сравнить наборы услуг.

Я подумал, что это из области MCA/PCA/MDS, но не уверен (смущает большое количество разношёрстных условий и предложений). Может быть, кто-то знает литературу в которой можно поискать пример решения схожей задачи или имеет опыт анализа таких данных и готов им поделиться? Предполагаю, что в банковской/страховой/финансовой аналитике такие задачи рассматривались и какие-то способы решения данных задач имеются. Бегло просмотрел CRAN Task Views в разделе финансы и эконометрия, подходящего ничего не нашёл.

Заранее спасибо за советы/рекомендации/предложения/примеры.


https://journal.r-project.org/archive/2016/...RJ-2016-054.pdf
  Форум: Медицинская статистика · Просмотр сообщения: #23721 · Ответов: 7 · Просмотров: 2257

p2004r
Отправлено: 30.01.2019 - 08:52


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(PYuliya @ 29.01.2019 - 15:06) *
Это проспективное когортное исследование. На данном этапе решили оценить толщину КИМ и проанализировать факторы риска в группах с КИМ+ и КИМ -


это наблюдение, и без контрольной группы оно несомненно "придет к открытию"
  Форум: Медицинская статистика · Просмотр сообщения: #23711 · Ответов: 6 · Просмотров: 1662

p2004r
Отправлено: 29.01.2019 - 14:49


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(PYuliya @ 29.01.2019 - 14:02) *
Добрый день!
Подскажите, правомочно ли при планировании дизайна исследования для определения факторов риска развития субклинического атеросклероза сравнение 2 групп пациентов с СД2 типа по наличию или отсутствию увеличения толщины комплекса интима-медиа, то есть без включения группы контроля здоровых лиц без СД2?

С Уважением, Юлия.



Это эксперимент или наблюдение?
  Форум: Медицинская статистика · Просмотр сообщения: #23706 · Ответов: 6 · Просмотров: 1662

p2004r
Отправлено: 27.01.2019 - 10:44


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(passant @ 23.01.2019 - 17:03) *
Ну, я так понял, что приведенную мною ссылку вы так и не прочитали. Жаль.


Не надо жалеть, все он прочитал, оттуда и скопировал скорее всего smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #23693 · Ответов: 4 · Просмотров: 1519

p2004r
Отправлено: 14.01.2019 - 14:49


Дух форума
*

Группа: Пользователи
Сообщений: 1072
Регистрация: 26.08.2010
Пользователь №: 22699


Цитата(зоо @ 12.01.2019 - 15:20) *
Еще такой вопрос. Если в ряде не 12 месяцев, а например 8, с октября по июнь. Корректно ли делать прогноз на неполных данных? Вообще в целом какое минимальное число месяцев в ряде должно быть для прогноза пусть на 1 год.


Это зависит от конкретных данных _прежде_ всего.

А спрашивать когда "едешь в машине" на форуме совета -- "делать ли мне поворот на лево после поворота на право", и потом вопрошать "а там мне по другому посоветовали, как теперь быть" бесполезное занятие.
  Форум: Медицинская статистика · Просмотр сообщения: #23659 · Ответов: 21 · Просмотров: 5625

43 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена