Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Кластерный анализ, реализации и эффекты
Игорь
сообщение 9.03.2023 - 13:01
Сообщение #1





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Не в порядке обсуждения, но если оно случится, буду рад.
При реализации классического метода k-средних были замечены интересные вычислительные эффекты. Если указать алгоритму некоторое количество кластеров, на которые будут разбиты объекты, то происходит следующее:
1. Количество [непустых] кластеров не может превысить определенное значение. Если в тестах задать, к примеру, число кластеров, равное числу объектов либо большее реально существующему, то выделено будет определенное количество кластеров. Остальные кластеры будут пустыми с нулевыми центрами.
2. Кластеризация не зависит от начального, например, случайного, разбиения. Из любой начальной конфигурации процесс итерационно сходится к тому же самому разбиению, что и из любой другой начальной конфигурации.
Предполагаем, что:
1. Метод устанавливает истинное распределение объектов по кластерам (конечно, в смысле используемой метрики).
2. Если стоит задача установления истинной конфигурации объектов, количество кластеров для данного метода можно вообще не задавать по той же причине. В результате расчета количество кластеров, объективно существующих в заданном массиве данных, будет равно количеству непустых кластеров.

Из минусов метода: придется нарисовать специфический график с облаками объектов в кластерах (на самом деле не сильно сложно).
Из плюсов: для агломеративного метода график можно вообще не рисовать. smile.gif

Сообщение отредактировал Игорь - 9.03.2023 - 13:54


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
ИНО
сообщение 24.05.2023 - 14:23
Сообщение #2





Группа: Пользователи
Сообщений: 204
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



Это действительно хорошая книга, написанная доступным языком, но конкретно по КА там информации очень мало. Больше про регрессию / методы обучения с учителем.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Игорь   Кластерный анализ   9.03.2023 - 13:01
- - Leonov   В разделе "Кластерный анализ, реализации и эф...   9.03.2023 - 19:44
- - Игорь   Спасибо за информацию.   10.03.2023 - 12:23
- - Игорь   Ну вот. Попалось подтверждение представленным выше...   7.05.2023 - 08:14
- - nokh   В порядке обсуждения:) Как ни странно, вообще не н...   10.05.2023 - 21:23
- - 100$   Даёшь вместо метода к - средних статистику Гопкинс...   11.05.2023 - 16:22
|- - ИНО   Цитата(100$ @ 11.05.2023 - 16:2...   12.05.2023 - 01:56
|- - Игорь   Цитата(ИНО @ 12.05.2023 - 02:56) ......   12.05.2023 - 10:09
- - ИНО   ИМХО, задача метода k-средних довольно специфическ...   12.05.2023 - 01:05
- - passant   ....   12.05.2023 - 09:39
- - ИНО   Игорь, спасибо за полезную ссылку. Однако там пред...   12.05.2023 - 16:06
|- - Игорь   Цитата(ИНО @ 12.05.2023 - 16:06) Как...   13.05.2023 - 07:46
- - ИНО   Там страниц много и ссылок на разные методы и обла...   13.05.2023 - 13:47
- - Blaid   В порядке обсуждения, как дилетант-любитель, встав...   20.05.2023 - 20:38
- - ИНО   F и всякие там SS - это из ANOVA/MANOVA, т. е. тре...   20.05.2023 - 21:25
- - Blaid   ЦитатаF и всякие там SS - это из ANOVA/MANOVA, т. ...   21.05.2023 - 09:56
- - ИНО   Что может быть непонятного в термине фокус исследо...   21.05.2023 - 19:01
- - Игорь   Считаю, что если целью работы [и нашего форума] яв...   24.05.2023 - 10:07
- - ИНО   Это действительно хорошая книга, написанная доступ...   24.05.2023 - 14:23


Добавить ответ в эту темуОткрыть тему