![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005 ![]() |
Коллеги, поясню новый вопрос. Есть случайный ряд чисел, мне нужно понять около какого значения сосредоточено наибольшее число других значений. Как это правильно сделать в R лучше, т.к. SPSS доверия все меньше и меньше (из-за ограниченного функционала)?
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 ![]() |
Возможно, не совсем понял глубину задачи, но рискну вставить свои пять копеек.
Если я правильно понял - у Вас есть выборка чисел, не важно как она получена. Вы хотите найти ответ на вопрос - как найти среди всех чисел такие, у которых в некоторой (фиксированной ??) окрестности которых находится максимальное количество точек выборки. Если это так - то упорядочиваете все свои числа. Затем циклом проходитесь по всем ним. Для каждого числа Xi считаете, сколько других точек находятся в интервале [Xi-A,Xi+A]. Получили новый ряд. Максимальное значение этого ряда и есть точка, вокруг которой "кучкуется" максимальное количество других точек. Можно график построить. В случае потребности - можно "поиграть" с выбором числа А. В многомерном случае все будет, конечно, сложнее. Но если Ваши данные числовые, если функция расстояния для каждой из координат одна и та-же, то особых проблем возникнуть не должно. Собственно, это некоторый простейший алгоритм кластеризации. В случае обнаружения нескольких точек "максимального скопления" - у Вас могут подучиться несколько кластеров. Ну, значит, такие у Вас данные. Или я что-то упустил в постановке задачи? Сообщение отредактировал passant - 6.06.2017 - 10:52 |
|
![]() |
![]() |
![]() ![]() |