Здравствуйте, гость ( Вход | Регистрация )
7.07.2007 - 22:24
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 21 Регистрация: 28.06.2007 Пользователь №: 4188 |
Как правильно подготовить данные для кластерного анализа?
Какие там "тонкие моменты"? Если часть данных в одних единицах измерения, а часть в других, как следует готовить данные предварительно? Если максимумы параметров разбросаны - один 0,3, другой 2? Следует ли делать какое-то преобразование? Уффф. |
|
|
![]() |
![]() |
![]() |
15.07.2007 - 19:08
Сообщение
#2
|
|
![]() Группа: Пользователи Сообщений: 1162 Регистрация: 10.04.2007 Пользователь №: 4040 |
Я предполагаю модифицировать метод k-средних с тем, чтобы в качестве координат центра тяжести кластера использовать не среднее значение, вычисление которого для неколичественных (в том числе смешанных) данных некорректно, а медиану Кемени (Вы совершенно точно определили ее суть).
Расстояние отношений вычисляется, как описано в книге Литвака. Разобраться непросто. Но метод очень интересен и эффективен. Замечу, что многомерный анализ смешанных и разнородных данных - это достаточно новые темы в анализе. Поэтому в различных стандартных программах данные методы пока могут быть не реализованы. ![]() Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
|
![]() |
![]() |
Statisticafil Классификация - Кластерный анализ 7.07.2007 - 22:24
плав Цитата(Statisticafil @ 7.07.2007 - 23... 9.07.2007 - 10:44
Statisticafil 1. Ага. А если (я снова о своём) в данных большое ... 10.07.2007 - 22:32
Statisticafil Ещё вопрос - в какой нибудь из относительно доступ... 11.07.2007 - 23:32
Игорь Стандартизовать количественные данные для кластерн... 13.07.2007 - 07:24
Statisticafil Спасибо за ответ Игорь.
ЦитатаОднако имеется недор... 13.07.2007 - 14:44
Игорь Так можно сделать. Логично.
Дискриминантный анали... 14.07.2007 - 15:17
Statisticafil Возможно ли рассчитать в Экселе "расстояние о... 15.07.2007 - 00:49
Игорь В электронном учебнике StatSoft сказано: "Пре... 29.09.2007 - 14:22![]() ![]() |