Здравствуйте, гость ( Вход | Регистрация )
7.07.2007 - 22:24
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 21 Регистрация: 28.06.2007 Пользователь №: 4188 |
Как правильно подготовить данные для кластерного анализа?
Какие там "тонкие моменты"? Если часть данных в одних единицах измерения, а часть в других, как следует готовить данные предварительно? Если максимумы параметров разбросаны - один 0,3, другой 2? Следует ли делать какое-то преобразование? Уффф. |
|
|
![]() |
![]() |
![]() |
29.09.2007 - 14:22
Сообщение
#2
|
|
![]() Группа: Пользователи Сообщений: 1162 Регистрация: 10.04.2007 Пользователь №: 4040 |
В электронном учебнике StatSoft сказано: "Предположим, вы уже имеете гипотезы относительно числа кластеров (по наблюдениям или по переменным). Вы можете указать системе образовать ровно три кластера так, чтобы они были настолько различны, насколько это возможно. Это именно тот тип задач, которые решает алгоритм метода K средних. В общем случае метод K средних строит ровно K различных кластеров, расположенных на возможно больших расстояниях друг от друга".
Это принципиально неверное утверждение. Метод K-средних строит не ровно K кластеров, а не более K кластеров. Если, исходя из принятых допущений, используемых мер и классифицируемых данных, кластеров реально меньше, чем K, например, K1, метод построит K1 кластеров, а (K - K1) кластеров из заданных K будут пустыми. ![]() Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
|
![]() |
![]() |
Statisticafil Классификация - Кластерный анализ 7.07.2007 - 22:24
плав Цитата(Statisticafil @ 7.07.2007 - 23... 9.07.2007 - 10:44
Statisticafil 1. Ага. А если (я снова о своём) в данных большое ... 10.07.2007 - 22:32
Statisticafil Ещё вопрос - в какой нибудь из относительно доступ... 11.07.2007 - 23:32
Игорь Стандартизовать количественные данные для кластерн... 13.07.2007 - 07:24
Statisticafil Спасибо за ответ Игорь.
ЦитатаОднако имеется недор... 13.07.2007 - 14:44
Игорь Так можно сделать. Логично.
Дискриминантный анали... 14.07.2007 - 15:17
Statisticafil Возможно ли рассчитать в Экселе "расстояние о... 15.07.2007 - 00:49
Игорь Я предполагаю модифицировать метод k-средних с тем... 15.07.2007 - 19:08![]() ![]() |