Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Классификация - Кластерный анализ
Statisticafil
сообщение 7.07.2007 - 22:24
Сообщение #1





Группа: Пользователи
Сообщений: 21
Регистрация: 28.06.2007
Пользователь №: 4188



Как правильно подготовить данные для кластерного анализа?
Какие там "тонкие моменты"?

Если часть данных в одних единицах измерения, а часть в других, как следует готовить данные предварительно?
Если максимумы параметров разбросаны - один 0,3, другой 2? Следует ли делать какое-то преобразование?

Уффф.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Игорь
сообщение 29.09.2007 - 14:22
Сообщение #2





Группа: Пользователи
Сообщений: 1162
Регистрация: 10.04.2007
Пользователь №: 4040



В электронном учебнике StatSoft сказано: "Предположим, вы уже имеете гипотезы относительно числа кластеров (по наблюдениям или по переменным). Вы можете указать системе образовать ровно три кластера так, чтобы они были настолько различны, насколько это возможно. Это именно тот тип задач, которые решает алгоритм метода K средних. В общем случае метод K средних строит ровно K различных кластеров, расположенных на возможно больших расстояниях друг от друга".
Это принципиально неверное утверждение. Метод K-средних строит не ровно K кластеров, а не более K кластеров. Если, исходя из принятых допущений, используемых мер и классифицируемых данных, кластеров реально меньше, чем K, например, K1, метод построит K1 кластеров, а (K - K1) кластеров из заданных K будут пустыми.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему