Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Формирование нескольких групп
Valeri
сообщение 5.03.2019 - 11:19
Сообщение #1





Группа: Пользователи
Сообщений: 3
Регистрация: 5.03.2019
Пользователь №: 33208



Какой лучше выбрать статистический метод для разделения выборки на несколько групп.
Группы необходимо сформировать по направленности изменения параметра. Например, у обследуемых людей регистрируем артериальное давление, ЧСС в состоянии покоя, затем предъявляем им нагрузку, и после нагрузки снова регистрируем данные показатели. Необходимо выделить группы людей по схожим изменениям АД и ЧСС при нагрузке, какой корректнее использовать статистический метод.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
comisora
сообщение 5.03.2019 - 14:54
Сообщение #2





Группа: Пользователи
Сообщений: 109
Регистрация: 27.12.2015
Пользователь №: 27815



Добрый день.
2Valeri

Посмотрите пакет kml и статью.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Valeri
сообщение 6.03.2019 - 11:51
Сообщение #3





Группа: Пользователи
Сообщений: 3
Регистрация: 5.03.2019
Пользователь №: 33208



Цитата(comisora @ 5.03.2019 - 14:54) *
Добрый день.
2Valeri

Посмотрите пакет kml и статью.


Спасибо.

Цитата(nokh @ 5.03.2019 - 23:08) *
Я бы тоже начал с разности "до-после", или учётом увеличения значений после нагрузки, для положительного знака (после-до). Для каждой из двух разностей можно построить гистограмму и плотность распределения, чтобы оценить однородность выборки. Ну а для описанной 100$ диаграммы рассеяния можно построить оценить двумерную плотность распределения (пример см. здесь: http://molbiol.ru/forums/index.php?showtop...51#entry1526151 ) В принципе, кластерный анализ можно применить и для этих двух разностей.


Спасибо.

Цитата(100$ @ 5.03.2019 - 20:37) *
Если размерность задачи равна двум (т.е. интересуют только два регистрируемых параметра), то задача может оказаться до смешного простой: по схеме "до-после" рассчитываем разность для каждого изучаемого параметра, для полученного двумерного распределения разностей на диаграмме рассеяния (scatterplot) пытаемся обнаружить линейные и нелинейные скопления/сгущения, и, если таковых не обнаруживаем, то, значит, задача кластеризации не имеет решения, возможна только группировка. Ну, а уж в группировке может помочь то, как данные рассыпались по соответствующим квадрантам: I (где оба знака изменения положительны), II,III и IV. В дальнейшем для этого двумерного распределения можно посчитать описательные статистики: коэффициент корреляции, взаимную информацию, вероятность попадания в первый квадрант, двумерную плотность, двумерную функцию распределения.


Спасибо
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему