Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Кластерный анализ, реализации и эффекты
Игорь
сообщение 9.03.2023 - 13:01
Сообщение #1





Группа: Пользователи
Сообщений: 1141
Регистрация: 10.04.2007
Пользователь №: 4040



Не в порядке обсуждения, но если оно случится, буду рад.
При реализации классического метода k-средних были замечены интересные вычислительные эффекты. Если указать алгоритму некоторое количество кластеров, на которые будут разбиты объекты, то происходит следующее:
1. Количество [непустых] кластеров не может превысить определенное значение. Если в тестах задать, к примеру, число кластеров, равное числу объектов либо большее реально существующему, то выделено будет определенное количество кластеров. Остальные кластеры будут пустыми с нулевыми центрами.
2. Кластеризация не зависит от начального, например, случайного, разбиения. Из любой начальной конфигурации процесс итерационно сходится к тому же самому разбиению, что и из любой другой начальной конфигурации.
Предполагаем, что:
1. Метод устанавливает истинное распределение объектов по кластерам (конечно, в смысле используемой метрики).
2. Если стоит задача установления истинной конфигурации объектов, количество кластеров для данного метода можно вообще не задавать по той же причине. В результате расчета количество кластеров, объективно существующих в заданном массиве данных, будет равно количеству непустых кластеров.

Из минусов метода: придется нарисовать специфический график с облаками объектов в кластерах (на самом деле не сильно сложно).
Из плюсов: для агломеративного метода график можно вообще не рисовать. smile.gif

Сообщение отредактировал Игорь - 9.03.2023 - 13:54


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
100$
сообщение 11.05.2023 - 16:22
Сообщение #2





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Даёшь вместо метода к - средних статистику Гопкинса!
Ссылка
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ИНО
сообщение 12.05.2023 - 01:56
Сообщение #3





Группа: Пользователи
Сообщений: 262
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



Цитата(100$ @ 11.05.2023 - 16:22) *
Даёшь вместо метода к - средних статистику Гопкинса!
Ссылка

Не шибко понял, какое отношение имеет статистика Хопкинса-Скеллама к кластеризации методом К-средних, хотя в целом идея проверки гипотрезы о стационарном Пуассоновском процессе как один из путей оценки реальности кластеров, полученных любым методом, выглядит интересно, хотя обычно это используют совсем для другого. вот монография, включающая вагон малую тележку методов анализа пространственного распределения точек, многие из которых, вероятно, можно оторвать оторвать от задач изучения размещения растений на поверхности земли, для которых они разрабатывались, и прикрутить к кластерному анализу иных данных. Извиняюсь за тою, что не дал ссылку на скачивание книги задаром, - не помню, где качал свой экземпляр, наверное, на Либгене. В общем, ищите по названию.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 12.05.2023 - 10:09
Сообщение #4





Группа: Пользователи
Сообщений: 1141
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(ИНО @ 12.05.2023 - 02:56) *
... какое отношение имеет статистика Хопкинса-Скеллама к кластеризации методом К-средних
В R так делают: https://ranalytics.github.io/data-mining/10...ng-Quality.html
Цитата(ИНО @ 12.05.2023 - 01:56) *
задач изучения размещения растений на поверхности земли, для которых они разрабатывались
Авторы монографии утверждают, что алгоритмы взяты из исследований по распределению звезд.

Сообщение отредактировал Игорь - 12.05.2023 - 14:39


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Игорь   Кластерный анализ   9.03.2023 - 13:01
- - Leonov   В разделе "Кластерный анализ, реализации и эф...   9.03.2023 - 19:44
- - Игорь   Спасибо за информацию.   10.03.2023 - 12:23
- - Игорь   Ну вот. Попалось подтверждение представленным выше...   7.05.2023 - 08:14
- - nokh   В порядке обсуждения:) Как ни странно, вообще не н...   10.05.2023 - 21:23
- - 100$   Даёшь вместо метода к - средних статистику Гопкинс...   11.05.2023 - 16:22
|- - ИНО   Цитата(100$ @ 11.05.2023 - 16:2...   12.05.2023 - 01:56
|- - Игорь   Цитата(ИНО @ 12.05.2023 - 02:56) ......   12.05.2023 - 10:09
- - ИНО   ИМХО, задача метода k-средних довольно специфическ...   12.05.2023 - 01:05
- - passant   ....   12.05.2023 - 09:39
- - ИНО   Игорь, спасибо за полезную ссылку. Однако там пред...   12.05.2023 - 16:06
|- - Игорь   Цитата(ИНО @ 12.05.2023 - 16:06) Как...   13.05.2023 - 07:46
- - ИНО   Там страниц много и ссылок на разные методы и обла...   13.05.2023 - 13:47
- - Blaid   В порядке обсуждения, как дилетант-любитель, встав...   20.05.2023 - 20:38
- - ИНО   F и всякие там SS - это из ANOVA/MANOVA, т. е. тре...   20.05.2023 - 21:25
- - Blaid   ЦитатаF и всякие там SS - это из ANOVA/MANOVA, т. ...   21.05.2023 - 09:56
- - ИНО   Что может быть непонятного в термине фокус исследо...   21.05.2023 - 19:01
- - Игорь   Считаю, что если целью работы [и нашего форума] яв...   24.05.2023 - 10:07
- - ИНО   Это действительно хорошая книга, написанная доступ...   24.05.2023 - 14:23


Добавить ответ в эту темуОткрыть тему