Цитата(nastushka @ 22.02.2018 - 14:04)

Подскажите, как можно решить такую задачу
1. есть данные, в них 20 переменных
2. нужно кластеризовать эти 20 переменных, т.е. выделить классы схожим переменных
3.затем найти людей, которые "кучкуются" у каждого класса переменных.
Например мы нашли 4 класса переменных абв, где, ежз, икл. наблюдения 1-30 кучкуются у класса к примеру ежз.
Что-то у вас все в кучу, мухи, котлеты, переменные, наблюдения, кластеры, классы, "кучки"....
Во-первых. Что такое "классы схожих переменных"? Вы имеете ввиду, что некоторые переменные у вас зависимые (коррелированны) между собой? И вы хотите из группы сильно коррелированных переменных оставить только одну? В любом случае, "классами" эти переменные я бы называть поостергся, а уж тем более их "кластеризовать"
Во-вторых. Что значит "кучкуются у каждого класса переменных"???

Тут у меня даже фантазии не хватает понять, что вы имеете ввиду.
В любом случае, рекомендую сначала прочитать хотя-бы краткое введение в кластерный анализ. Может - поймете сами чего нужно, но по крайней мере - сумеете хоть внятно объяснить свою задачу в общеупотребимых терминах
Или второе возможное действие - описать вашу прикладную задачу, и дать возможность специалистам самим разобраться кого и куда "кластеризовать"