Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> почему в SPSS и Statistica разные ре-ты
Де бин Анатолий
сообщение 28.04.2015 - 11:06
Сообщение #1





Группа: Пользователи
Сообщений: 25
Регистрация: 15.08.2014
Пользователь №: 26591



Ещё вопросик из экономики. Сделал быстрый кластерный анализ к-мин. Но группы попавшие в 4 кластера в спсс и статистика не совпадают. Вот эксель файл. Там вкладки с результатами кластеризации в спсс и статистика. Из-за чего это?
И такой вопрос. На первой вкладке исходные данные. Надо ли эти цифры как-то нормализовывать или оставить как есть,а то они большие, речь о миллионных суммах?
Прикрепленные файлы
Прикрепленный файл  Spreadsheet1.rar ( 119,34 килобайт ) Кол-во скачиваний: 287
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Де бин Анатолий
сообщение 28.04.2015 - 12:58
Сообщение #2





Группа: Пользователи
Сообщений: 25
Регистрация: 15.08.2014
Пользователь №: 26591



1. А как мне интерпретировать вот допустим:
наблюдение 1 кластер 2 расстояние =9046523457,445 какой я могу сделать вывод из этого расстояния. Оно подлежит интерпретации
2.Есть ли метод в статистики, который сам определяет требуется ли нормализация или нет.
3.Если в кластере одно наблюдение можно ли этот кластер считать как полноценный?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 28.04.2015 - 13:26
Сообщение #3





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Де бин Анатолий @ 28.04.2015 - 12:58) *
1. А как мне интерпретировать вот допустим:
наблюдение 1 кластер 2 расстояние =9046523457,445 какой я могу сделать вывод из этого расстояния. Оно подлежит интерпретации
2.Есть ли метод в статистики, который сам определяет требуется ли нормализация или нет.
3.Если в кластере одно наблюдение можно ли этот кластер считать как полноценный?


1. Увы не понял что спрашивается.

2. Такого метода нет, но над ним усиленно работают smile.gif Пока приходится компактно визуализировать матрицу дистанций и "смотреть глазами".

3. В случае иерархического разбиения на кластеры их вообще переменное число (от состоящих из одного наблюдения, до состоящего из всех наблюдений выборки сразу), а для выбора автоматического оптимального числа кластеров есть несколько алгоритмов (в том числе даже патентованных smile.gif ).


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему