Кластерный анализ - Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Кластерный анализ, реализации и эффекты

Игорь Просмотр профиля	9.03.2023 - 13:01 Сообщение #1
Группа: Пользователи Сообщений: 1162 Регистрация: 10.04.2007 Пользователь №: 4040	Не в порядке обсуждения, но если оно случится, буду рад. При реализации классического метода k-средних были замечены интересные вычислительные эффекты. Если указать алгоритму некоторое количество кластеров, на которые будут разбиты объекты, то происходит следующее: 1. Количество [непустых] кластеров не может превысить определенное значение. Если в тестах задать, к примеру, число кластеров, равное числу объектов либо большее реально существующему, то выделено будет определенное количество кластеров. Остальные кластеры будут пустыми с нулевыми центрами. 2. Кластеризация не зависит от начального, например, случайного, разбиения. Из любой начальной конфигурации процесс итерационно сходится к тому же самому разбиению, что и из любой другой начальной конфигурации. Предполагаем, что: 1. Метод устанавливает истинное распределение объектов по кластерам (конечно, в смысле используемой метрики). 2. Если стоит задача установления истинной конфигурации объектов, количество кластеров для данного метода можно вообще не задавать по той же причине. В результате расчета количество кластеров, объективно существующих в заданном массиве данных, будет равно количеству непустых кластеров. Из минусов метода: придется нарисовать специфический график с облаками объектов в кластерах (на самом деле не сильно сложно). Из плюсов: для агломеративного метода график можно вообще не рисовать. Сообщение отредактировал Игорь - 9.03.2023 - 13:54 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!

Ответов

ИНО Просмотр профиля	12.05.2023 - 16:06 Сообщение #2
Группа: Пользователи Сообщений: 290 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632	Игорь, спасибо за полезную ссылку. Однако там предлагают использовать статистику Хопикнса-Скеллама не для проверки "правильности" конкретной кластеризации, а лишь для определения "общей предрасположенности имеющихся данных к объединению в кластеры" - то есть примерно то же самое, для ее обычно применяют, только с переносом из реального физического пространства в некое абстрактное математическое. В связи с этим совершенно непонятно, каким образом 100$ предлагает применять ее "вместо метода к - средних". Но, думается, можно пойти дальше и применять методы, созданные для анализа пространственных распределений точек (например функции Рипли, Бессага и др. - см. монографию по мое ссылке) для изучения структуры кластеров, выделенных при кластерном анализе, либо чисто визуально на ординационной диаграмме многомерного шкалирования (последнее лично мне больше нравится). Цитата Авторы монографии утверждают, что алгоритмы взяты из исследований по распределению звезд. Какие именно методы и какой конкретной монографии?

Игорь Просмотр профиля	13.05.2023 - 07:46 Сообщение #3
Группа: Пользователи Сообщений: 1162 Регистрация: 10.04.2007 Пользователь №: 4040	Цитата(ИНО @ 12.05.2023 - 16:06) Какие именно методы ...? Кластерного анализа - мы ведь его в данной теме обсуждаем. Цитата(ИНО @ 12.05.2023 - 16:06) ... какой конкретной монографии? Baddeley с соавт., на которую Вы ссылку дали - мы же о ней говорили. С. 459: "Cluster processes were developed in a classic paper Neyman and Scott [499] as models for the spatial pattern of galaxies in the distant universe". Сообщение отредактировал Игорь - 13.05.2023 - 07:47 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!

Сообщений в этой теме

Игорь Кластерный анализ 9.03.2023 - 13:01

Leonov В разделе "Кластерный анализ, реализации и эф... 9.03.2023 - 19:44

Игорь Спасибо за информацию. 10.03.2023 - 12:23

Игорь Ну вот. Попалось подтверждение представленным выше... 7.05.2023 - 08:14

nokh В порядке обсуждения:) Как ни странно, вообще не н... 10.05.2023 - 21:23

100$ Даёшь вместо метода к - средних статистику Гопкинс... 11.05.2023 - 16:22

ИНО Цитата(100$ @ 11.05.2023 - 16:2... 12.05.2023 - 01:56

Игорь Цитата(ИНО @ 12.05.2023 - 02:56) ...... 12.05.2023 - 10:09

ИНО ИМХО, задача метода k-средних довольно специфическ... 12.05.2023 - 01:05

passant .... 12.05.2023 - 09:39

ИНО Игорь, спасибо за полезную ссылку. Однако там пред... 12.05.2023 - 16:06

Игорь Цитата(ИНО @ 12.05.2023 - 16:06) Как... 13.05.2023 - 07:46

ИНО Там страниц много и ссылок на разные методы и обла... 13.05.2023 - 13:47

Blaid В порядке обсуждения, как дилетант-любитель, встав... 20.05.2023 - 20:38

ИНО F и всякие там SS - это из ANOVA/MANOVA, т. е. тре... 20.05.2023 - 21:25

Blaid ЦитатаF и всякие там SS - это из ANOVA/MANOVA, т. ... 21.05.2023 - 09:56

ИНО Что может быть непонятного в термине фокус исследо... 21.05.2023 - 19:01

Игорь Считаю, что если целью работы [и нашего форума] яв... 24.05.2023 - 10:07

ИНО Это действительно хорошая книга, написанная доступ... 24.05.2023 - 14:23

« Предыдущая тема · Медицинская статистика · Следующая тема »

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум