Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

28 страниц V   1 2 3 > » 

100$
Отправлено: 26.01.2020 - 14:34


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Диагностик @ 26.01.2020 - 02:42) *
Профессор Орлов считает это невежеством.


Я бы назвал это "не вызывающим симпатий проф. Орлова пристрастием к устаревшим статистическим технологиям".

Но вы можете отписать ему в том духе, что, мол, я Диагностик Александрович, проживающий по адресу такому-то, все осознал и минимизировал не расстояние хи-квадрат между двумя распределениями, а расстояния Кульбака-Лейблера, Хеллингера и Бхаттачарьи-Рао до кучи. Дата, подпись.
Порадуйте человека. Так сказать - ложь во спасение.
  Форум: Медицинская статистика · Просмотр сообщения: #25203 · Ответов: 13 · Просмотров: 470

100$
Отправлено: 26.01.2020 - 01:01


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Чтобы, наконец, поставить точку в этой теме: о том, что параметры можно отыскивать по минимуму хи-квадрата ясно написано у Крамера: $30.3 стр. 461.
Желающие вольны ознакомиться.

Да, чуть не забыл: применительно к конкретной задаче - стоит только прологарифмировать сырые данные, как без без 196-го значения критерий Шапиро-Уилка "успокаивается"

> shapiro.test(x[-196,])

Shapiro-Wilk normality test

data: x[-196, ]
W = 0.98636, p-value = 0.05677

ядерная оценка плотности (с Гауссовым ядром и шириной окна ,18 (оптимизированная методом максимального правдоподобия)) не обнаруживает намеков на двухмодальность, и тесты на симметричность (Смирнова, Фрейзера, Уилкоксона и Бхаттачарьи-Гаствирта-Райта) не отклоняют гипотезу симметричности распределения в т.ч. относительно неизвестного центра.

Впрочем, на dxdy Диагностику Санычу о логнормальном распределении уже намекнули. Да он по простоте душевной внимания не обратил...
  Форум: Медицинская статистика · Просмотр сообщения: #25199 · Ответов: 13 · Просмотров: 470

100$
Отправлено: 25.01.2020 - 14:01


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Диагностик @ 25.01.2020 - 13:45) *
Использовалось 16. 16-5-1=10.


Ясно. Тогда все верно. "Все правильно, все сходится, ребёночек - не наш".

А ответ на изначальный вопрос "Можно или нет?" будет зависеть от
а) того, в каком соотношении находятся минимум хи-квадрата и максимум логарифмической ф-ции правдоподобия;
б) статистических свойств полученных оценок. Н-р, дисперсия может быть неприлично велика.
  Форум: Медицинская статистика · Просмотр сообщения: #25194 · Ответов: 13 · Просмотров: 470

100$
Отправлено: 25.01.2020 - 13:06


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Диагностик @ 25.01.2020 - 12:39) *
5,76 и 10.


А откуда 10-то? У вас 19 разрядов гистограммы.
  Форум: Медицинская статистика · Просмотр сообщения: #25192 · Ответов: 13 · Просмотров: 470

100$
Отправлено: 24.01.2020 - 14:01


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Верно ли я понял из скудной мотивировочной части поста, что описанная методика породила некий итерационный процесс, критерием окончания которого явился факт первого неотвержения нулевой гипотезы общим критерием согласия "Хи-квадрат"?
Если да, то хотелось бы получить конкретные результаты: само значение хи-квадрата в точке "оптимума" и число степеней свобод df. Ибо здесь о-о-очень легко напортачить.

P.S. И да, на dxdy придержите за пуговицу юзера барсук. А то он, похоже, дал себе честное слово экспериментально доказать, что модель в виде смеси кучи гауссиан способна бесконечно переобучаться (в силу безграничной делимости нормального распределения ежу понятно, что три кривульки подгоняют ("фитят") лучше, чем две,а четыре - лучше, чем три etc). И ведь докажет же...
  Форум: Медицинская статистика · Просмотр сообщения: #25180 · Ответов: 13 · Просмотров: 470

100$
Отправлено: 10.01.2020 - 13:53


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Игорь @ 10.01.2020 - 08:20) *
Понимаете, если бы это был просто троллинг (которым он и является по факту), на этом можно было закончить обсуждение. В принципе, ничего экстраординарного - так обычно развлекаются весьма подготовленные люди на специализированных форумах, отбивая у новичков желание общаться и сводя ценность опубликованной информации к нулю. Для этого применяют ряд методов, основные из которых - необоснованное расширение темы обсуждения и увод обсуждения от основной темы во второстепенные ветки. Методы обычные для "научной" дискуссии. Но человек написал "помогите понять". А начинается понимание с четкого определения понятий и заканчивая нюансами. Свое мнение я изложил в работе, где логистическая регрессия практически полностью описана на 1 странице, включая ссылки на авторитеные источники, и добавить более нечего.


Игорь, дайте, пожалуйста, отдохнуть вашему фонтану.
  Форум: Медицинская статистика · Просмотр сообщения: #25117 · Ответов: 9 · Просмотров: 774

100$
Отправлено: 10.01.2020 - 12:26


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 10.01.2020 - 10:50) *
А в чём считали многомерного Спирмена?


В Экселе руками. Все как обычно.
  Форум: Медицинская статистика · Просмотр сообщения: #25115 · Ответов: 25 · Просмотров: 18392

100$
Отправлено: 8.01.2020 - 22:29


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Игорь @ 8.01.2020 - 20:06) *
Какое отношение данное замечание имеет к обсуждаемой в теме логистической регрессии?


Непосредственное.


Цитата
Достаточно взять любой источник и убедиться, что выражение, называемое коллегой логитом, является множественной линейной регрессией.


Которая моделирует Ln(Pi/(1-Pi))

Вы растренировались, Игорь.
  Форум: Медицинская статистика · Просмотр сообщения: #25096 · Ответов: 9 · Просмотров: 774

100$
Отправлено: 8.01.2020 - 17:14


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Игорь @ 8.01.2020 - 16:59) *
Не могу согласиться с данным во втором и третьем абзацах определением логита.


Ибо истинный Логит - это логарифм отношения вероятности наступления события к вероятности того, что оно не произойдет.
  Форум: Медицинская статистика · Просмотр сообщения: #25094 · Ответов: 9 · Просмотров: 774

100$
Отправлено: 7.01.2020 - 13:05


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 31.10.2019 - 08:17) *
Сообщение #19 подкорректировал, материалы к сообщению прикрепил.


Указанную главу в монографии прочел и вижу решение этой задачи немного иначе.

Поскольку вектор признакового описания объектов содержит 11 координат, возникает соблазн изучения совместного распределения всех этих цитокинов, интерлейкинов и гормонов стресса. Тут бы я срочно вспомнил, что многомерные обобщения rho Спирмена предлагались Реймхартом и ван Зейленом (1978), Вольфом (1980) и Джо (1990).
Посему для всех 4 групп я бы рассчитал соответствующие многомерные rho, состряпал бы из них интересующий меня линейный контраст и уж его-то с чувством, с толком, с расстановкой бутстрапировал бы до упаду. Опосля чего с устатку накатил бы шамбертена.

P.S. Для датасета "Доноры" многомерный Спирмен rho(11)=0.007547. При тестировании матрицы попарных пирсоновских корреляций chi2=43.35[0.87], т.е. нулевая гипотеза о том, что корреляционная матрица не отличается от единичной, не отвергается. Словом, вес корреляционного графа для нее можно и не рассчитывать ).

P.P.S. На стр. 176 монографии формула для G записана так, что формально условию |rij|>=cutoff соответствует и главная диагональ корр. матрицы. Де-факто же (как это следует из скрипта) суммируются только наддиагональные модули. В общем, на будущее в таких формулах при значке суммы надо просто указывать соотношение для i и j: "j>i".
  Форум: Медицинская статистика · Просмотр сообщения: #25091 · Ответов: 25 · Просмотров: 18392

100$
Отправлено: 28.09.2019 - 15:12


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 28.09.2019 - 00:49) *
Также моделирование наглядно показало, что высокая дискретность данных приводит к дискретности распределения разностей, а далее - и к дискретности р-значений. Поскольку я совсем не математик, то оценить степень (не)тривиальности такого эмпирического заключения не могу pardon.gif ))


Для непараметрики это - тривиальная тривиальщина .
  Форум: Медицинская статистика · Просмотр сообщения: #24595 · Ответов: 6 · Просмотров: 1087

100$
Отправлено: 21.09.2019 - 17:05


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694




"Ну, что тебе сказать про Сахалин? На острове нормальная погода".

А данные ваши невыносимо плохие: по природе - непрерывные, а на деле - дискретные. Поскольку цифири в пределах каждого столбца различаются аж на три порядка, то их, конечно, можно считать независимыми в совокупности, но вряд ли - одинаково распределенными.

1. Формальное применение дисперсионного анализа невозможно из за гетероскедастичности. Поэтому единственное, что можно сделать для ответа на первый вопрос - это оттестировать гипотезу однородности мат. ожиданий против альтернативы упорядоченности критерием имени Томаса Хеттманспергера, который (критерий) дает z=8.44 и p-value~0. Из чего делаем вывод, что композиция антибиотиков А+Б давит штаммы сильнее, чем просто А, а А+Б+С - сильнее, чем А или А+Б

2. Ответ на второй вопрос - нестатистический. Можно считать резистентными все те, которые > 32, а может - > 64, а может - только >=128 и т.д.

3. Построить гистограммку - но не ту, которой пользуются для восстановления формы плотности, а для конкретных пользовательских диапазонов, н-р, 0-1, 1-4, 4-16, 16-32, 32-64, 64-128. Для таким образом дискретизированной переменной можно получить (гладкие) непараметрические оценки плотности.
  Форум: Медицинская статистика · Просмотр сообщения: #24571 · Ответов: 1 · Просмотров: 745

100$
Отправлено: 6.07.2019 - 16:25


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
Не обижайтесь, но у вас второе предложение противоречит первому.


Да какие уж тут обиды ). Но вы окажете мне большую услугу, если воспримете норму не как придуманную мной наспех сущность (ее ввели в оборот сильно задолго до меня), а как способ восстановления пропущенных значений во временном ряду.

Цитата
А "норма" у крысы, как и у человека, представляет собой диапазон значений, а не одно число.
Первый попавшийся пример... - уровень холестерина от 40 до 130 является "нормальным".


Чистая правда. Которая кроме сказанного означает, что любое число из этого диапазона является решением задачи. Н-р, всем известная структурная средняя по имени "медиана" при нечетном объеме выборки представляет собой интервал, являющийся решением, каждая точка которого, в свою очередь, тоже является решением.



Цитата
Поэтому в доклиническом исследовании трудно вообразить адекватный эксперимент без контрольной группы (обычно контролей еще и несколько) и/или измерения начальных значений изучаемых параметров.
Если копнуть еще глубже, то показатели биохимии имеют свойство серьезно меняться в зависимости от времени года и от диеты (крыса - животное деликатное, хуже только кролик). Плюс гендерные различия. Плюс линейные крысы разных линий тоже различаются


Это всё - статистически усредняемые параметры. И все они известны, и в конечном итоге формируют некий информационный фон, теоретический костыль, без которого любой экспериментатор будет попусту крыс переводить на компост.
  Форум: Медицинская статистика · Просмотр сообщения: #24164 · Ответов: 13 · Просмотров: 1883

100$
Отправлено: 5.07.2019 - 16:26


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(ogurtsov @ 5.07.2019 - 14:15) *
Для биохимии нету нулевой точки, то есть "как биохимия мозга зависит от глубины воздействия стресса" мы не узнаем в ходе данного эксперимента.


Не надо плодить сущности. Есть понятие физиологической нормы. "Нулевой точкой" является вектор интересующих исследователя показателей биохимии, соответствующий физиологической норме (т.е. полученных от животных, не подвергавшихся никакому стрессовому воздействию). Применительно к обсуждаемому дизайну можно допустить, что показатели физиологической нормы известны и автору темы, и его коллегам со времен царя Гороха. Он же не Робинзон Крузо, варящийся в собственном соку на необитаемом острове.

Только эта норма в данном случае и не нужна.Как не нужна здесь и контрольная группа. Мы просто берем и начинаем угнетать психику стрессовым воздействием. И три набора показателей биохимии мозга, полученных на разных уровнях непрерывного по природе фактора "степень предпочтения сахарозы", выступающего в качестве ковариаты, - экспериментальный факт. Вот вас и просят протестировать гипотезу о случайности наблюдаемых различий.
  Форум: Медицинская статистика · Просмотр сообщения: #24159 · Ответов: 13 · Просмотров: 1883

100$
Отправлено: 5.07.2019 - 13:53


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
Ну а животных-то зачем убивать?


Чтобы снять у них биохимию мозга. Живой-то особи в башку не зелезешь...

Цитата
У вас цель состояла в анализе предпочтения сахарозы


Как по мне - так ничего подобного. Есть стрессогенный фактор, есть время. Об уровне воздействия стрессогенного фактора с течением времени судят по косвенному показателю - степени предпочтения сахарозы. После чего пытаются понять:как биохимия мозга зависит от глубины воздействия стресса. Усреднение уровня сахарозы будет происходить сначала по 15 объектам выборки, затем - по 10 и т.д. (ковариата). А собственно биохимия (дисперсионный комплекс в данном случае) будет представлена тремя независимыми выборками по 5 убиенных крыс. Погибших во имя науки.
  Форум: Медицинская статистика · Просмотр сообщения: #24157 · Ответов: 13 · Просмотров: 1883

100$
Отправлено: 21.05.2019 - 13:32


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 21.05.2019 - 12:57) *
Уже настроился с бутстрепом для Жаккара разбираться (т.к. с первого раза по аналогии с прописями не вышло), поэтому просто не догадался про ДИ для частот. Про Жанга - Ли ещё не слышал, использую в последнее время байесовский априорный интервал Джеффриса. Есть в онлайновом калькуляторе EpiTools (http://epitools.ausvet.com.au/content.php?page=CIProportion , здесь же ссылка на статью с формулами), также добавил его в экселевский калькулятор плава (Доверительный интервал для долей.xls в папке Программы к Практикуму: https://yadi.sk/d/g50i73pt3J6pAa).


Э-х-х, про Джеффриса-то я и забыл.

Кстати, глянул на данные из Ассоциации_2012.xls и при виде кучи столбцов из нулей и единиц тотчас вспомнил про дискриминантный анализ в пространстве дихотомических переменных из статьи Гибба и Штриммера 2015 г. См. пакет {binDA} для R и сопроводиловку к нему. Там приятным для глаз бонусом идет способность метода ранжировать предикторы по важности с выдачей соответствующей гистограммки.
  Форум: Медицинская статистика · Просмотр сообщения: #23977 · Ответов: 13 · Просмотров: 2589

100$
Отправлено: 21.05.2019 - 11:33


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 20.05.2019 - 22:06) *
С 95% ДИ для Жаккара и бутстреп-оценками р по ДИ повожусь когда будет больше времени.


А зачем? Индекс Жаккара идейно представляет собой просто долю объектов с одновременной совстречаемостью признаков в выборке, из которой предварительно исключены объекты с их (признаков) одновременным отсутствием. Почему бы просто не рассчитать ДИ для доли: Клоппера - Пирсона, Уилсона, Агрести - Коула, арксинуса, ... вот недавно открыл для себя ДИ по Жангу - Ли?

Просто интересно.
  Форум: Медицинская статистика · Просмотр сообщения: #23974 · Ответов: 13 · Просмотров: 2589

100$
Отправлено: 20.05.2019 - 22:16


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 20.05.2019 - 22:06) *
Огромное спасибо! Теперь мои студентки смогут сами посчитать значимость в Excel yahoo.gif
Вставил вашу формулу в R:

Jaccard <- function (x, y)
{
C11 <- sum(x == 1 & y == 1)
A10 <- sum(x == 1 & y == 0)
B01 <- sum(x == 0 & y == 1)
N<-(C11+A10+B01)
mysum<-0
for(x in 0:(C11-1))
{
mysum<-mysum+choose(N,x)*(2^(N-x))
}
return(list(Jaccard.index=(C11/N),
"p.value"=(1-mysum/(3^N))))
}

#Пример
> a<-c(1,1,1,1,1,0,1)
> b<-c(1,1,1,1,1,1,0)
> Jaccard(a,b)
$`Jaccard.index`
[1] 0.7142857

$p.value
[1] 0.04526749

Задача решена, тему можно считать закрытой.
С 95% ДИ для Жаккара и бутстреп-оценками р по ДИ повожусь когда будет больше времени.


Здорово, nokh. Не знал про choose(). Думал, что комбинаторику придется делать по старинке через факториалы. Ну, все к лучшему.
  Форум: Медицинская статистика · Просмотр сообщения: #23972 · Ответов: 13 · Просмотров: 2589

100$
Отправлено: 20.05.2019 - 16:51


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 19.05.2019 - 22:09) *
Будем рады такому подарку!


Тогда ловите. С нашего стола вашему столу ).

Файл с поддержкой макросов в формате .xlsm. Открывать Экселем не старше 2007-го. Если настройки безопасности заблокируют макросы, то надо через центр управления безопасностью разрешить их выполнение.
Пользоваться очень просто: либо в затененном месте с пометкой "Исходная таблица сопряженности" заносите свои данные, либо для произвольной предварительно сделанной таблицы сопряженности выделяете на любом листе в рабочей книге строку о двух столбцах, вносите туда функцию "Jaccard" следующим образом: "=Jaccard()" (без кавычек) и указываете в качестве ее аргумента таблицу сопряженности 2х2. (Синтаксис можно увидеть, встав на ячейку Е10). Затем нажимаете комбинацию клавиш "Ctrl+Shift+Enter". Функция вернет массив, первым значением в котором будет индекс Жаккара, а вторым - p-value. И вся любовь.
Прикрепленные файлы
Прикрепленный файл  Жаккар.rar ( 13,59 килобайт ) Кол-во скачиваний: 28
Прикрепленный файл  Жаккар.rar ( 13,59 килобайт ) Кол-во скачиваний: 29
 
  Форум: Медицинская статистика · Просмотр сообщения: #23969 · Ответов: 13 · Просмотров: 2589

100$
Отправлено: 19.05.2019 - 14:12


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
Буду разбираться и пытаться программировать, хотя скорее всего здесь у меня из R получится BASIC.


Вряд ли R в этой истории будет предпочтительней VBA, поскольку в Экселе ф-ция =ЧИСЛКОМБ() работает, как минимум, не хуже. Если что, могу написать вам на VBA формулу для расчета и Жаккара и p-value к нему. Так сказать, мой подарок челябинским братьям по разуму. Если что, факториалы в R - это просто factorial(число). Факториалы вам понадобятся для комбинаторных расчетов.


Цитата
А что вы думаете по поводу такого подхода: удалить из набора данных строки двойных нулей (ячейка D) и считать Монте-Карло или exact только оставшиеся ячейки?


Дума здесь на удивление проста: если есть возможность за обозримое время вычислить точное значение методом перебора всех перестановок - то предпочту ее (возможность). Тем более, что формулы (16) и (17) - ровно о том же.
И все это только потому, что в идеале для монтекарловских p-value необходимо строить еще и доверительный интервал. Это в принципе несложно, но программисту возни немного больше.

P.S. А пакет jaccard у меня не загрузился. Начал требовать наличия на компе компиляторов C/C++.
P.P.S. А как работает этот пакет - вообще не понял, ибо не нашел в описании не только рабочих формул или вменяемых описаний алгоритмов, но даже ссылок на соответствующие источники.
  Форум: Медицинская статистика · Просмотр сообщения: #23966 · Ответов: 13 · Просмотров: 2589

100$
Отправлено: 17.05.2019 - 20:53


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 17.05.2019 - 00:17) *
Провели анализ микробных ассоциаций в ожоговых ранах, выборка хорошая - более 400 проб. При оценке значимости ассоциаций с помощью индекса Жаккара в R-пакете jaccard выявилась такая штука: относительно большие индексы могли оказаться незначимыми (J=0.32; Р=0,504), а почти нулевые - значимыми (J=0.06; P=0.049). Если интересно - могу выложить данные, хотя я понял почему так происходит и сделал простой маленький пример. Стал искать другие пути, но не получается справиться самостоятельно. Буду очень признателен за помощь. Описание проблемы и вопросы в прикреплённом файле Help. Второй файл - статья, на которую есть надежда. Может ещё какие варианты подскажите...



По поводу формул (16) и (17) из статьи - да все правильно: VR3,N=3^N по ф-ле (14). Соответственно, VR2,N-x=2^(N-x). Оба этих коэффициента получены в предположении, что D=0, откуда делаем единственно возможный вывод, что применительно к нашему случаю N=A+B+C+0=A+B+C. Можете смело программировать. К слову, для рассматриваемой в качестве примера таблицы с(5,1,1,0) для J=,71428571 вычисления по формуле (17) дают p-value=.045267. При всем при том, что тест отношения правдоподобия для этой таблицы статистически не значим.
  Форум: Медицинская статистика · Просмотр сообщения: #23962 · Ответов: 13 · Просмотров: 2589

100$
Отправлено: 12.05.2019 - 14:54


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 11.05.2019 - 22:05) *
Насколько корректно применять анализ главных компонент к временным рядам? Полазил по зарубежным форумам и увидел разные мнения. То, что так считают и есть много публикаций - факт, однако PCA основан на корреляциях, для которых требование независимости наблюдений в выборке нарушена. Хочу применить к медицинским данным: динамика изменения 5-7 показателей (температура, ЧСС, АД и др.) у отельного пациента в течение 30 дней после операции.


Предварительный диагноз - корректно. Не знаю, что такое Time-Wise PCA в Statistica, но навскидку нагуглил вот такую симпатичную статью:здесь
  Форум: Медицинская статистика · Просмотр сообщения: #23947 · Ответов: 6 · Просмотров: 1731

100$
Отправлено: 27.04.2019 - 22:27


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Конечно, можно. А (уважаемому) председателю тактично сообщить, что за корректность расчетов несет ответственность не статпакет, а - horribile dictu! - исследователь. Как он нес ее в докомпьютерные времена. Вооружившись калькулятором.
  Форум: Медицинская статистика · Просмотр сообщения: #23911 · Ответов: 1 · Просмотров: 1292

100$
Отправлено: 18.04.2019 - 20:47


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(alina.K @ 18.04.2019 - 12:23) *
Всё, вы очень помогли. А почему МАНОВА требует чтобы M-BOX не был стат значим, что говорит о том, что многомерные методы уместно использовать. а линейный ДА не требует.


Линейная модель требует гомогенности ковариашек, квадратичная (то бишь нелинейная) - нет.
  Форум: Медицинская статистика · Просмотр сообщения: #23905 · Ответов: 7 · Просмотров: 1899

100$
Отправлено: 17.04.2019 - 20:50


Дух форума
*

Группа: Пользователи
Сообщений: 727
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(alina.K @ 17.04.2019 - 14:33) *
100$, а можете подсказать как интерпретировать эту строчку априорных вероятностей.
Prior probabilities of groups:
setosa versicolor virginica
0.3619048 0.3333333 0.3047619
что значит setosa 0,36


Да, это доля каждого конкретного сорта в обучающей выборке. Иначе говоря, в вашей обучающей выборке из 105 цветков было 38 сетоз. Откуда a priori p(Setosa)=38/105=.3619048...


Цитата
А также как мне интерпретировать постериорные вероятности?
p=predict(z,test)
posterior
setosa versicolor virginica
22 1.000000e+00 5.966703e-20 5.555393e-41
23 1.000000e+00 1.638449e-24 5.197733e-48
25 1.000000e+00 4.449308e-16 1.260953e-36


Да так и интерпретировать, что построенное по обучающей выборке классифицирующее правило объекты тестовой выборки с номерами 22, 23 и 25 считает принадлежащими классу Setosa с единичной вероятностью.
  Форум: Медицинская статистика · Просмотр сообщения: #23903 · Ответов: 7 · Просмотров: 1899

28 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена