Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

27 страниц V   1 2 3 > » 

100$
Отправлено: 5.03.2019 - 20:37


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Valeri @ 5.03.2019 - 11:19) *
Какой лучше выбрать статистический метод для разделения выборки на несколько групп.
Группы необходимо сформировать по направленности изменения параметра. Например, у обследуемых людей регистрируем артериальное давление, ЧСС в состоянии покоя, затем предъявляем им нагрузку, и после нагрузки снова регистрируем данные показатели. Необходимо выделить группы людей по схожим изменениям АД и ЧСС при нагрузке, какой корректнее использовать статистический метод.


Если размерность задачи равна двум (т.е. интересуют только два регистрируемых параметра), то задача может оказаться до смешного простой: по схеме "до-после" рассчитываем разность для каждого изучаемого параметра, для полученного двумерного распределения разностей на диаграмме рассеяния (scatterplot) пытаемся обнаружить линейные и нелинейные скопления/сгущения, и, если таковых не обнаруживаем, то, значит, задача кластеризации не имеет решения, возможна только группировка. Ну, а уж в группировке может помочь то, как данные рассыпались по соответствующим квадрантам: I (где оба знака изменения положительны), II,III и IV. В дальнейшем для этого двумерного распределения можно посчитать описательные статистики: коэффициент корреляции, взаимную информацию, вероятность попадания в первый квадрант, двумерную плотность, двумерную функцию распределения.
  Форум: Медицинская статистика · Просмотр сообщения: #23781 · Ответов: 7 · Просмотров: 432

100$
Отправлено: 21.02.2019 - 22:50


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(metalmary @ 21.02.2019 - 19:29) *
Народ, help.gif плиз! Есть данные в абсолютных числах, нужно среднее арифметическое перевести в процент от начального значения (контроля, принятого за 100 процентов). Как пересчитать стандартную ошибку среднего относительно процентов? Например. среднее значение составило 4.57+-1.25, это составило 125,1 %+-... процентов от контроля. Видела такое в некоторых зарубежных статьях. Как это пересчитать.?


Ох, гуманитарии, вы гуманитарии... Учить вас - только портить. А ведь в школьном курсе математики пропорции идут сразу после таблицы умножения.

Есть в статистике относительная величина под названием "показатель точности опыта", численно равная отношению стандартной ошибки среднего к этому самому среднему. Смекаете, к чему это я?
А к тому, что при любом пересчете среднего показатель точности опыта останется постоянным. В данном случае =1,25/4,57=,273523. Потом умножаем его на 125,1 и получаем окончательный результат: 125,1 +- 34,22. А уж если умножить 34,22 да на 1,96 - тут до полуширины непараметрического 95%-ного доверительного интервала для среднего - рукой подать.
  Форум: Медицинская статистика · Просмотр сообщения: #23754 · Ответов: 4 · Просмотров: 452

100$
Отправлено: 31.12.2018 - 17:09


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(зоо @ 31.12.2018 - 16:11) *
Хороший вопрос по поводу того что считать кратко-долгосрочностью
Ну смотрите к примеру есть ряд за 3 года (36 месяцев) по продажам. предсказание на три месяца это краткосрочный прогноз? а на 20 месяцев?
или например есть данные по валютам, поминутно агрегированные. В дне 1440 минут. будет ли прогноз от начала дня на на 10 часов т.е. 600 минут вперед долгосрочным?
Как определить что краткосрочным является, а что долгосрочным?


Все ваши страдания по пустякам проистекают от незнания давным-давно отлитой в граните эконометрической мудрости: к прогнозированию допускаются модели, у которых на заданном горизонте прогноза MAPE <10%.
  Форум: Медицинская статистика · Просмотр сообщения: #23622 · Ответов: 21 · Просмотров: 2482

100$
Отправлено: 29.12.2018 - 02:35


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(зоо @ 29.12.2018 - 01:37) *
100$, подскажите, пожалуйста, для моделей экспоненциального сглаживания и АРИМЫ, есть ли предпочтения по кратко и долгосрочному прогнозу? Например, какие модели лучше для долгосрочного прогнозирования, а какие для краткосрочного или разницы нет


Модель экспоненциального сглаживания (ЭС) - это способ механического (не статистического) выравнивания временного ряда, в то время как АРИМА - полноценная статистическая модель. Это означает, что у экспоненциального сглаживания нет такого понятия как дисперсия прогноза, а у АРИМ'ы - есть. Для ответа на собственные вопросы вам надо смоделировать временной ряд, для части этого ряда (н-р, 80% его длины) подогнать АРИМУ и ЭС, на оставшихся 20% сделать прогноз и рассчитать его дисперсию. Ничего более интересного предложить не могу. Сам ЭС всерьез никогда не воспринимал.
  Форум: Медицинская статистика · Просмотр сообщения: #23618 · Ответов: 21 · Просмотров: 2482

100$
Отправлено: 28.12.2018 - 23:10


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(зоо @ 28.12.2018 - 17:35) *
Подскажите, а всегда ли надо избавлять ряд от тренда?


Ну, "всегда" - вряд ли, но поскольку дальше всего удалось продвинуться в изучении именно стационарных рядов, то предварительно остационарить ряд обычно невозбранно.
  Форум: Медицинская статистика · Просмотр сообщения: #23616 · Ответов: 21 · Просмотров: 2482

100$
Отправлено: 26.12.2018 - 15:10


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(зоо @ 26.12.2018 - 11:16) *
А реализация критерия Фостера-Стюарда есть в R?


/справочно/

Традиционно при анализе временных рядов под словом "тренд" разумеют тренд среднего, тренд дисперсии или тренд а/корреляции. Гипотеза о неизменности во времени этих вероятностных характеристик известна как гипотеза стационарности временного ряда. Поэтому мейнстримом в этом вопросе является уже упомянутая бездонная тема под общим названием "Unit Root Testing". Вот ее-то и надо изучать. Патамушта ряд работ, опубликованных Дики и Фуллером в 1976-1979 гг. обнулил все антикварные тесты вроде теста Манна - Кендалла, Аббе - Линника, Фостера - Стюарта, автокорреляции (н-р, в форме Дюфора - Роя), которые с тех пор представляют разве что исторический интерес.

В этом смысле на два порядка разумнее воспользоваться тестом Филиппса - Перрона (PP.test{stats}), но уж никак не Фостером - Стюартом.
При этом отдавая себе отчет в том, что все эти тесты даже на смоделированных данных обладают околонулевой мощностью.
  Форум: Медицинская статистика · Просмотр сообщения: #23609 · Ответов: 21 · Просмотров: 2482

100$
Отправлено: 4.12.2018 - 18:03


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата
Но не понимаю ряд показателей. Например, что значит lhs 89==>rhs 78. Как это понять?


lhs - это левая часть правила (Left-Hand-Side), rhs - соответственно, правая. Выделенные правила записываются в формате lhs=>rhs, знак "=>" переводится как "влечет за собой", т.е. в записи {89} => {78} множество {78} ассоциируется с множеством {89}. Для выделенных правил вычисляются статистики: support (поддержка), confidence (достоверность) и lift (подъемная сила)

P.S. Вы даже знак => воспроизвели с ошибкой. Нехорошо.

Цитата
Второе, когда я визуализирую график. Что значит эти красные кружки. Зеленые, это мои категории(номинативные не метрические)


Вообще-то, при визуализации выделенных правил в виде графа, кружки обозначают именно что правила. Их размер чаще всего пропорционален уровню поддержки правила. Почему они двух цветов (красные и зеленые) - не знаю. Вам виднее.
  Форум: Медицинская статистика · Просмотр сообщения: #23561 · Ответов: 2 · Просмотров: 978

100$
Отправлено: 30.11.2018 - 21:24


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Сделал логлинейный анализ 3-входовой таблицы сопряженности (из предыдущего поста) в R.

Краткий отчет:

1. Сделал в Экселе массив, пригодный для работы с R. Назвал его незатейливо: Dogs. В этом массиве 4 столбца: три из них соответствуют факторам "Тип поражения" (Б-бактериальный, Г - грибковый, К-комбинированный), "Порода"(1-9) и "Область" (I-VIII) соответственно, четвертый ("Отклик") - содержит наблюдаемые частоты.
Нулевые ячейки этого массива заменил на ,5.

> head(Dogs,8)

Тип Порода Область Отклик
Б 1 I 13
Б 1 II 4
Б 1 III 4
Б 1 IV 5
Б 1 V 13
Б 1 VI 4
Б 1 VII 6
Б 1 VIII 7

2. Определил "Тип" "Породу" и "Область" как факторы:

> str(Dogs)

'data.frame': 216 obs. of 4 variables:
$ Тип : Factor w/ 3 levels "Б","Г","К": 1 1 1 1 1 1 1 1 1 1 ...
$ Порода : Factor w/ 9 levels "1","2","3","4",..: 1 1 1 1 1 1 1 1 2 2 ...
$ Область: Factor w/ 8 levels "I","II","III",..: 1 2 3 4 5 6 7 8 1 2 ...
$ Отклик : num 13 4 4 5 13 4 6 7 6 1 ...

3. Для логлинейной параметризации модели воспользовался функцией loglm() из пакета {MASS}

>library(MASS)

4. Нулевая гипотеза при логлинейном анализе заключается в том, что модель не противоречит наблюдаемым частотам, альтернативная - в том, что противоречит.
Соответственно, если после исключения к-л фактора из модели, она по-прежнему не противоречит исходным данным, то фактор считаем статистически незначимым.
Тестирование гипотезы осуществляется критерием отношения правдоподобия (Likelihood ratio test)

5. Логлинейное моделирование таблицы сопряженности заключается в построении т.н. иерархической модели, при которой включение трехфакторного взаимодействия в качестве предиктора автоматически влечет за собой включение двухфакторных взаимодействий и исходных факторов. Такая модель называется насыщенной (saturated) и не имеет познавательной ценности, поскольку точно подгоняет наблюдаемые частоты. Построим ее для примера:

> model.saturated<-loglm(Отклик~Тип*Порода*Область, Dogs)

> model.saturated

Call:
loglm(formula = Отклик ~ Тип * Порода * Область, data = Dogs)

Statistics:
X^2 df P(> X^2)
Likelihood Ratio 0 0 1
Pearson 0 0 1

Как видно, чудес не произошло, и модель идеально соответствует наблюдаемым частотам. Поэтому идея логлинейного моделирования заключается в том, чтобы более экономно (меньшим количеством параметров) параметризовать модель, поглядывая при этом на результаты тестирования нулевой гипотезы.

6. Переоценим модель, исключив из нее трехфакторное взаимодействие:

> m1<-loglm(Отклик~Тип:Порода+Тип:Область+Порода:Область,Dogs)
> m1


Call:
loglm(formula = Отклик ~ Тип:Порода + Тип:Область + Порода:Область,
data = Dogs)

Statistics:
X^2 df P(> X^2)
Likelihood Ratio 48.81494 112 1
Pearson 48.24563 112 1

Модель по-прежнему не противоречит наблюдаемым частотам.

7. Проверим, допускает ли модель дальнейшее упрощение: удалим из нее все двухфакторные взаимодействия.

> m2<-loglm(Отклик~Тип+Порода+Область,Dogs)
> m2


Call:
loglm(formula = Отклик ~ Тип + Порода + Область, data = Dogs)

Statistics:
X^2 df P(> X^2)
Likelihood Ratio 131.4224 198 0.9999225
Pearson 144.9575 198 0.9982221

Модель по-прежнему адекватна данным. Так что двухфакторные взаимодействия статистически незначимы. А среди них было и драгоценное "Порода:Область".
В общем, по этой базе данных делаем вывод, что природой не "предусмотрена" зависимость локализации кожных поражений от породы, равно как и предрасположенность к-л. пород / областей к определенному типу поражения.

P.S. К аналогичному выводу можно придти, если насыщенную модель упрощать не вручную, а автоматически с помощью функции step(), которая с опцией "backward" по информационному критерию Акаике (AIC) ищет наиболее удачную параметризацию модели. В нашем случае такая модель тоже не противоречила наблюдаемым частотам.
  Форум: Медицинская статистика · Просмотр сообщения: #23554 · Ответов: 10 · Просмотров: 2146

100$
Отправлено: 29.11.2018 - 21:59


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата
Если бы я был первый день на формуле, ваша манера вести дискуссию, наверно, произвела бы на меня впечатление. Но увы, тем кто тут давненько - она хорошо известна. Поэтому ваши личностные выпады, от которых вы ну никак не можете воздержаться, уже ни у кого не вызывают ни удивления, ни уважения ни нервного трепета. А уж благоговения перед великим и всезнающим - тем более. Но это так, к слову.


Очередное кисо обиделось. Ни вашего впечатления, ни вашего удивления, ни вашего нервенного трепета, и, паче того, вашего благоговения - ничего из вышеперечисленного мне не требуется - я не старьевщик.


Просто не хочу, чтобы в анналах форума бережно хранились фразы типа "правда вопрос - а где их взять - математики оставляют за скобками". Никто никого в статистике не просит где-то взять и предъявить (вынь да положь!) истинные функции распределения. Достаточно того факта, что по теореме Гливенко - Кантелли эмпирическая функция распределения является состоятельной и несмещенной оценкой истинной функции распределения. И критерий Смирнова поданные на его вход выборки "перемалывает" именно в две ЭФР.

Цитата
В-третьих, вопрос, который я действительно упоминал, заключался в том, на сколько эмпирическая функция распределения (которая используется в критерии) соответствует функции распределения данной генеральной совокупности (объективно существующей) - в данном тесте никак не изучается и не учитывается (ну, кроме зависимости от N, естественно).


Именно, что учитывается. Уже хотя бы потому что теорема Гливенко - Кантелли 1933 г.р., и как только она была доказана, тотчас же Колмогоров предложил свой критерий, а Смирнов - свой.

А что такое "зависимость от N"?
  Форум: Медицинская статистика · Просмотр сообщения: #23549 · Ответов: 24 · Просмотров: 3280

100$
Отправлено: 29.11.2018 - 18:37


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(passant @ 29.11.2018 - 15:27) *
/Еще более меланхолично/
На вход критерия Смирнова подаются две выборки, по которым вычисляется статистика Колмогорова-Смирнова, которая сравнивается с критическим значением, которое (в свою очередь) определяется из теоретических соображений. И - в конечном итоге - делается вывод, взяты-ли две исходные выборки из одной ген.совокупности или из разных. По факту он сравнивает эмпирические распределения двух выборок (не путать с критерием Колмогорова!!!)
Какую функцию распределения может вычислить критерий, призванный лишь проверить Гипотезу об однородности выборок unknw.gif


Выйдите, passant, ненадолго из меланхоличного состояния и послушайте, чего скажу. Устами проф. Орлова:

с.88:
"Критерий Смирнова основан на использовании эмпирических функций распределения Fm(x) и Gn(x), построенных по первой и второй выборкам соответственно.
Значение статистики Смирнова Dm,n=sup|Fm(x)-Gn(x)| сравнивают с соответствующим критическим значением ... и по результатам сравнения принимают или отклоняют гипотезу Ho о совпадении (однородности) функций распределения." /Эконометрика: учебник для вузов.- изд. 4, дополн. и перераб. - Ростов н/Д: Феникс,2009. - 572 с./

Если вам критически важно построение эмпирических функций распределения (ЭФР, как я и написал) считать самостоятельным этапом, а не частью работы по вычислению критерия, то тогда надо писать, что на "...вход критерия Смирнова подаются две ЭФР".

Но мой пост был ровно о том, что математики ни от кого не скрывали, где надо "брать" ЭФР для критерия, это просто вы не в курсе.

P.S. И не надо благодарить, коллега. Расширять ваш кругозор для меня - удовольствие.
  Форум: Медицинская статистика · Просмотр сообщения: #23547 · Ответов: 24 · Просмотров: 3280

100$
Отправлено: 29.11.2018 - 13:22


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(passant @ 29.11.2018 - 11:25) *
На самом деле, если подумать, использование критериев типа Cтьюдента, Фишера и пр. и уж тем более - сравнение по перекрытию доверительных интервалов - идет от желания сократить расходы на вычисления. Потому что единственный "полный" метод сравнения двух случайных выборок - это критерий Смирнова (или - обычно пишут "Колмогорова-Смирнова"). Вот он корректно сравнивает две случайные величины используя их функции распределения (правда вопрос - а где их взять - математики оставляют за скобками). А все остальные критерии по сути были придуманы в виду "ленности", а в реалии - запредельной сложности расчетов в докомпьютерную эру вычислений.


/меланхолично/
Чего для такую забористую чушь нести...

/справочно/
Для критерия Смирнова функции распределения не надо "брать" - критерий вычисляет их (ЭФР) "сам".
  Форум: Медицинская статистика · Просмотр сообщения: #23543 · Ответов: 24 · Просмотров: 3280

100$
Отправлено: 28.11.2018 - 02:09


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(paravoz @ 27.11.2018 - 03:34) *
Например, при расчете смертности у нас число умерших составило 18 000 человек. У нас есть данные о возрасте смерти каждого из этих 18 000 (например, по базам смертности Росстата или по реестрам ОМС). Если мы говорим о возрасте смерти 18 000 человек, то это уже будет распределение возраста смерти. Рассчитав средний возраст смерти насколько корректно/возможно в данном случае посчитать доверительный интервал для среднего возраста смерти?


Здесь все до смешного просто:
1) вы восстановили плотность этого распределения и видите, что оно унимодально, на удивление симметрично, не остро- и не плосковершинное (т.е. с эксцессом все в порядке), тяжелых хвостов не наблюдается. Вы решаете, что истинное распределение возраста смерти в некоей генсовокупности - нормальное распределение. Нормальное распределение - двухпараметрическое, и в качестве одного из параметров выступает теоретическое среднее. В силу закона больших чисел эмпирическое среднее сходятся-таки к теоретическому, причем выборочное среднее - это состоятельная, несмещенная и эффективная оценка теоретического среднего. Таким образом параметр распределения возможно состоятельно оценить по выборке. А дальше вы ищете два числа, про которые можно сказать, что они являются концами интервала, который с заданным уровнем / коэффициентом доверия накрывает истинный (неизвестный статистику) параметр распределения. С дисперсией (вторым параметром нормального распределения) все то же самое.

2) вы восстановили плотность этого распределения и у вас кровь из глаз пошла: кривое, косое, асимметричное, лептокуртичное, многомодальное с тяжелыми хвостами. Никакой подходящей аппроксимации вообще не просматривается. Вот и возникает резонный вопрос - а входит ли оно вообще к какое-либо параметрическое семейство? И, если да, то можно ли вообще эти параметры состоятельно оценить по выборке? Если нет, то в этом случае эмпирическое среднее останется лишь обобщающим статистическим показателем, а состоятельной оценкой истинного параметра распределения - нет. Ну и зачем тогда к нему лепить какой-то доверительный интервал?

Касаемо, н-р, показателя смертности, ситуацию вижу так: числитель этой дроби представляет собой счетную величину, измеренную в абсолютной шкале. Ее можно отмоделировать распределением Пуассона. Знаменатель - среднегодовая численность населения, очень грубо (помесячно) = численность предыдущего периода+родившиеся в данном периоде-умершие в данном периоде. На мгновение предположим (по совету коллег), что это тоже (случайная) пуассонова величина. Тогда в полный рост встает вопрос: а как распределено отношение двух пуассоновских величин? Это распределение может зависеть от параметров, которые по выборке оценить в принципе невозможно.

Далее. Пусть у нас есть временной ряд, состряпанный из ежегодных показателей смертности для конкретной территории. По методике расчета данного показателя видно, что члены это ряда не являются независимыми одинаково распределенными с.в. Ряд будет автокоррелирован, если можно так выразиться, по построению. Так вот для того, чтобы такой ряд имел хоть-какую-то познавательную ценность, в нем придется интересоваться не безусловными квантилями этого распределения, а квантилями условного распределения, условного по имеющейся предыстории.
  Форум: Медицинская статистика · Просмотр сообщения: #23539 · Ответов: 24 · Просмотров: 3280

100$
Отправлено: 26.11.2018 - 16:39


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Предварительные расчеты с комментариями прикрепил
Прикрепленные файлы
Прикрепленный файл  Собаки_Баскервилей_2.rar ( 19,62 килобайт ) Кол-во скачиваний: 36
 
  Форум: Медицинская статистика · Просмотр сообщения: #23530 · Ответов: 10 · Просмотров: 2146

100$
Отправлено: 26.11.2018 - 14:57


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Елена Гогуа @ 26.11.2018 - 14:34) *
Если это разные области - да.


Вас понял. Понятие типизации относится не к собаке в целом, а к конкретной области.

Ну, теперь подбиваем итоги по породам считаем краевые суммы и пытаемся понять, как сделать логлинейный анализ трехвходовой таблицы сопряженности, ее многомерный анализ соответствий, попутно решая утилитарный вопрос: нужно ли последнюю свору собак считать одной категорией "прочие" или работать с каждой из них, как с самостоятельной породой.
  Форум: Медицинская статистика · Просмотр сообщения: #23529 · Ответов: 10 · Просмотров: 2146

100$
Отправлено: 26.11.2018 - 11:57


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Рецензенту надо тактично объяснить, что доверительные интервалы строятся к параметрам распределения, но никак не к индексным величинам. Особливо, если индекс представляет собой отношение мертвых к живым, причем мертвые не являются репрезентативной выборкой из ген. совокупности живых.
  Форум: Медицинская статистика · Просмотр сообщения: #23526 · Ответов: 24 · Просмотров: 3280

100$
Отправлено: 25.11.2018 - 02:20


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Да, Елена, здравствуйте.
Таблицу посмотрел, уже гораздо "теплее". Остался один вопрос: вот, гляжу я на экземпляр "порода1-12" и вижу, что у нее встречается и грибок, и комбинированная патология.
Так _действительно_ может быть?
  Форум: Медицинская статистика · Просмотр сообщения: #23523 · Ответов: 10 · Просмотров: 2146

100$
Отправлено: 8.11.2018 - 21:59


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


На с.2 есть смысл заменить "Эвре" на "Эрве".
  Форум: Медицинская статистика · Просмотр сообщения: #23498 · Ответов: 1 · Просмотров: 1088

100$
Отправлено: 1.11.2018 - 21:45


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата
Я тогда еще примерно такую таблицу выкладывала.


Я это видел. И впал в уныние. И все, кто это видел, тоже впали в уныние. p2004r вам на это намекнул.

Цитата
Добавила в ваш файл на второй лист свои данные (там, правда, заголовки на английском и области пронумерованы).


О том и речь, что из этой базы данных надо сотворить вот такую таблицу сопряженности+подвести итоги по породам. Самый подходящий кандидат на эту роль - вы.

Цитата
Если без Бонферроней, это нужно будет еще немецкому профессору аргументировать...


Логлинейная параметризация таблицы сопряженности не требует никаких коррекций уровней значимости.
  Форум: Медицинская статистика · Просмотр сообщения: #23490 · Ответов: 10 · Просмотров: 2146

100$
Отправлено: 1.11.2018 - 20:28


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694



Вам всего-то-навсего надо заполнить таблицу сопряженности по шаблону (см. прикрепленный файл) - и вся недолга. Кроме вас это сделать некому. А уж далее мы будем посмотреть ея на предмет сопряженностей, как и договаривались еще в мае. При анализе таблицы сопряженности не понадобится никаких Бонферроней, тестов и попарных сравнений.
Прикрепленные файлы
Прикрепленный файл  Собаки_Баскервилей.rar ( 6,64 килобайт ) Кол-во скачиваний: 33
 
  Форум: Медицинская статистика · Просмотр сообщения: #23488 · Ответов: 10 · Просмотров: 2146

100$
Отправлено: 20.10.2018 - 23:27


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694







Цитата
Я сейчас всю графику в отчёты и статьи строю в KyPLot... Пакет очень хорош как конструктор для научной графики: этакий мини Origin (OriginLab Corp.)


Да, я помню, вы неоднократно об этом говорили. Заметно, что разработчики любят годные картинки и не жалеют на это сил.

Цитата
А статистических фенек в нём больше. Например можно факторный анализ проводить методом главных факторов с итерациями по общностям и использовать в качестве начальных значений таковые, вычисленные по Йореско - именно как в "Факторный, дискриминантый и кластерный анализ" рекомендуется (+ другие методы факторного анализа с разными как ортогональными, так и косоугольными вращениями). Также если подать на вход матрицу сходства, можно кластеризацию методом Уорда делать для любых расстояний(досчитывал так за PAST).


Если я еще не до конца забыл, что такое факторный анализ, и с чем его едят, то методов оценки общностей придумано бесчисленное количество, методов экстракции факторов - и того больше, а уж количество вращений и вовсе зашкаливает за все мыслимые пределы. Все это 100 лет назад реализовано в том же SPSS. Сказать, что это изобилие сильно помогает понять, как устроен мир, не могу. Это примерно как с 15-тью методами рандомизации.

В общем, как человек, способный запрограммировать статистический метод любой сложности и не имеющий к тому никакой мотивации, не могу назвать ни KyPlot, ни PAST программами своей мечты.
  Форум: Медицинская статистика · Просмотр сообщения: #23463 · Ответов: 15 · Просмотров: 46997

100$
Отправлено: 20.10.2018 - 21:58


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 20.10.2018 - 21:26) *
Последняя версия пакета KyPlot, ещё недавно стоившая 1000$, стала бесплатной. Слава Коичи Йошиоке!
http://www.kyenslab.com/en/index.html


Да, галерея графики - няшная, из статистических "фенечек" впечатлился наличием процедуры Двасса - Стила в качестве пост хоков в дисперсионном анализе. Впрочем, имея перед глазами Холлендера и Вульфа (1999) не так это все сложно запрогать и самому... В общем, миленько, но не более того...
  Форум: Медицинская статистика · Просмотр сообщения: #23461 · Ответов: 15 · Просмотров: 46997

100$
Отправлено: 18.10.2018 - 20:02


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nikita_zab @ 18.10.2018 - 19:33) *
Да, вопрос касался не оценки разных сторон одних и тех же данных, а именно "ковровых бомбардировок".


В копилку философских вопросов: совместная проверка распределения на асимметрию+эксцесс - это уже "ковровая бомбардировка", или еще нет?
  Форум: Медицинская статистика · Просмотр сообщения: #23448 · Ответов: 6 · Просмотров: 1765

100$
Отправлено: 17.10.2018 - 23:37


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(100$ @ 17.10.2018 - 22:51) *
> Nokh, спасибо, почитаю.


Ну, вот, прочитал первые 37 страниц и ... "я вас прошу, нет, я вас просто умоляю" словосочетание "математического ожидаемого" на с. 37 заменить на "математического ожидания".
  Форум: Медицинская статистика · Просмотр сообщения: #23443 · Ответов: 8 · Просмотров: 1987

100$
Отправлено: 17.10.2018 - 22:51


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


> Nokh, спасибо, почитаю.
  Форум: Медицинская статистика · Просмотр сообщения: #23442 · Ответов: 8 · Просмотров: 1987

100$
Отправлено: 17.10.2018 - 15:30


Дух форума
*

Группа: Пользователи
Сообщений: 696
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 17.10.2018 - 13:01) *
В пособии имеются неизбежные недочёты и ошибки (мои и авторов пакета PAST). Буду признателен за информацию о них на почту: biostat74@mail.ru , Тема "Практикум по биостатистике"
В начале 2019 выложу версию со вставкой страниц с исправлениями, комментариями некоторых моментов и т.п.


Я с превеликим удовольствием и несомненной пользой для себя посмотрел бы, но по ссылке мне ничего не открылось, кроме предложения "Установить диск для Windows", на каковую кнопку я нажимать поопасился. Может, тут можно выложить?
  Форум: Медицинская статистика · Просмотр сообщения: #23438 · Ответов: 8 · Просмотров: 1987

27 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена