Автор: kont 13.05.2016 - 13:25
Вопрос больше не по статистике, а по программам. Скажите, есть ли стат.пакеты (коммерческие и не очень, типа R) в которых реализовано
1. подбор оптимального метода кластеризации (KNN,иерархический КА, к-средних, Кохонен...)
2.автоматический выбор числа кластеров. Не важно что мы кластеризуем, переменные или людей?
Автор: p2004r 13.05.2016 - 16:26
Цитата(kont @ 13.05.2016 - 13:25)
Вопрос больше не по статистике, а по программам. Скажите, есть ли стат.пакеты (коммерческие и не очень, типа R) в которых реализовано
1. подбор оптимального метода кластеризации (KNN,иерархический КА, к-средних, Кохонен...)
2.автоматический выбор числа кластеров. Не важно что мы кластеризуем, переменные или людей?
периодически такой вопрос встречается
например https://cran.r-project.org/web/packages/mclust/mclust.pdf
а вообще посмотреть, почитать обновляемый обзор https://cran.r-project.org/web/views/Cluster.html
Автор: passant 16.05.2016 - 21:13
Цитата(kont @ 13.05.2016 - 13:25)
2.автоматический выбор числа кластеров. Не важно что мы кластеризуем, переменные или людей?
Ну, на счет "автоматического" - не уверен, но некоторые "регулярные" подходы к решению вопроса все-же известны.
Например:
http://it-visnyk.kpi.ua/wp-content/uploads/2011/07/53_19.pdf
http://www.nbuv.gov.ua/old_jrn/natural/eis/2010_3/20_Scherbakova.pdf
http://simulation.su/uploads/files/default/immod-2005-1-158-162.pdf