Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Классификация - Кластерный анализ
Statisticafil
сообщение 7.07.2007 - 22:24
Сообщение #1





Группа: Пользователи
Сообщений: 21
Регистрация: 28.06.2007
Пользователь №: 4188



Как правильно подготовить данные для кластерного анализа?
Какие там "тонкие моменты"?

Если часть данных в одних единицах измерения, а часть в других, как следует готовить данные предварительно?
Если максимумы параметров разбросаны - один 0,3, другой 2? Следует ли делать какое-то преобразование?

Уффф.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Игорь
сообщение 15.07.2007 - 19:08
Сообщение #2





Группа: Пользователи
Сообщений: 1162
Регистрация: 10.04.2007
Пользователь №: 4040



Я предполагаю модифицировать метод k-средних с тем, чтобы в качестве координат центра тяжести кластера использовать не среднее значение, вычисление которого для неколичественных (в том числе смешанных) данных некорректно, а медиану Кемени (Вы совершенно точно определили ее суть).

Расстояние отношений вычисляется, как описано в книге Литвака. Разобраться непросто. Но метод очень интересен и эффективен.

Замечу, что многомерный анализ смешанных и разнородных данных - это достаточно новые темы в анализе. Поэтому в различных стандартных программах данные методы пока могут быть не реализованы.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему