Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Как измерить плотность чисел к числу
kont
сообщение 5.06.2017 - 19:18
Сообщение #1





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005



Коллеги, поясню новый вопрос. Есть случайный ряд чисел, мне нужно понять около какого значения сосредоточено наибольшее число других значений. Как это правильно сделать в R лучше, т.к. SPSS доверия все меньше и меньше (из-за ограниченного функционала)?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ogurtsov
сообщение 5.06.2017 - 20:30
Сообщение #2





Группа: Пользователи
Сообщений: 127
Регистрация: 15.12.2015
Пользователь №: 27760



Около - слишком абстрактно. Вся выборка в каком-то смысле "сосредоточена" вокруг среднего/моды/медианы.
Если значения дробные, достаточно просто округлить до некоторого количества знаков после запятой и найти моду.
Можно разбить на интервалы фиксированной длины и посчитать количество значений в каждом из них (построить гистограмму - hist(), результат присвоить переменной и рассмотреть, что там внутри), затем взять интервал с максимальным количеством и найти в нем медиану.

Сообщение отредактировал ogurtsov - 5.06.2017 - 20:31


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
kont
сообщение 5.06.2017 - 20:43
Сообщение #3





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005



я имел ввиду в плане расстояний. у какого значения кучкуются 80% других значений к примеру.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ogurtsov
сообщение 5.06.2017 - 20:55
Сообщение #4





Группа: Пользователи
Сообщений: 127
Регистрация: 15.12.2015
Пользователь №: 27760



Цитата(kont @ 5.06.2017 - 20:43) *
я имел ввиду в плане расстояний. у какого значения кучкуются 80% других значений к примеру.

Кластеризация что ли так странно описана? Ну, сделайте кластеризацию.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
kont
сообщение 5.06.2017 - 22:13
Сообщение #5





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005



я о ней думал, но как корректно сделать ее, чтобы на графике был отображен центр, при том что я кластеризую случайный набор чисел, а не наблюдения
с(4 87 6 0875 87 50 87508 7 5 0875 8655 ....)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
kont
сообщение 5.06.2017 - 22:15
Сообщение #6





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005



вообщем я хочу показать что 8-0% случайных значений близки к числу x, остальные далеко
Простите если невнятно объясняю(

Сообщение отредактировал kont - 5.06.2017 - 22:15
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 5.06.2017 - 23:24
Сообщение #7





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(kont @ 5.06.2017 - 22:15) *
вообщем я хочу показать что 8-0% случайных значений близки к числу x, остальные далеко
Простите если невнятно объясняю(


Kont, а почему бы вам не создать на форуме одну-единственную персональную тему и с некоторой периодичностью не публиковать там свои вопросы?
Ну, вместо того, чтобы за...(censored)...хламлять форум опусами, которые, судя по статистике просмотров, не интересны никому от слова "вообще"?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 6.06.2017 - 10:49
Сообщение #8





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Возможно, не совсем понял глубину задачи, но рискну вставить свои пять копеек.
Если я правильно понял - у Вас есть выборка чисел, не важно как она получена. Вы хотите найти ответ на вопрос - как найти среди всех чисел такие, у которых в некоторой (фиксированной ??) окрестности которых находится максимальное количество точек выборки.
Если это так - то упорядочиваете все свои числа. Затем циклом проходитесь по всем ним. Для каждого числа Xi считаете, сколько других точек находятся в интервале [Xi-A,Xi+A].
Получили новый ряд. Максимальное значение этого ряда и есть точка, вокруг которой "кучкуется" максимальное количество других точек. Можно график построить. В случае потребности - можно "поиграть" с выбором числа А.
В многомерном случае все будет, конечно, сложнее. Но если Ваши данные числовые, если функция расстояния для каждой из координат одна и та-же, то особых проблем возникнуть не должно.
Собственно, это некоторый простейший алгоритм кластеризации. В случае обнаружения нескольких точек "максимального скопления" - у Вас могут подучиться несколько кластеров. Ну, значит, такие у Вас данные.
Или я что-то упустил в постановке задачи?

Сообщение отредактировал passant - 6.06.2017 - 10:52
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
kont
сообщение 6.06.2017 - 18:48
Сообщение #9





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005



100$, смените тон общения. Я не собираюсь Вас учить грамматике общения, да и образование у меня не психологическое, но с людьми много общаюсь и могу Вам сказать, чтобы Вы последили за своей речью. Она носит конфликтогенный характер. Скрытая транзакция("Ху(cencored) тут расписался своими сообщениями"). Мне такой тон не нравится, и я имею право об этом говорить. Ваша природная язвительность тут неуместна. Вы возможно меня старше, Вашего возраста я не знаю, но я делаю Вам замечание. Вы можете тактично молчать. Я прошу к этому аспекту просто не возвращаться. Я задаю вопросы не для флуда, чтобы Вы не беспокоились. К тому же не так-то часто я пишу. Вчера появилось 2 вопроса. Если у Вас ко мне претензии, просьба в ЛС, я Вас внимательно выслушаю.

Сообщение отредактировал kont - 6.06.2017 - 18:52
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 7.06.2017 - 01:07
Сообщение #10





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(kont @ 6.06.2017 - 18:48) *
100$, смените тон общения. Я не собираюсь Вас учить грамматике общения, да и образование у меня не психологическое, но с людьми много общаюсь и могу Вам сказать, чтобы Вы последили за своей речью. Она носит конфликтогенный характер. Скрытая транзакция("Ху(cencored) тут расписался своими сообщениями"). Мне такой тон не нравится, и я имею право об этом говорить. Ваша природная язвительность тут неуместна. Вы возможно меня старше, Вашего возраста я не знаю, но я делаю Вам замечание. Вы можете тактично молчать. Я прошу к этому аспекту просто не возвращаться. Я задаю вопросы не для флуда, чтобы Вы не беспокоились. К тому же не так-то часто я пишу. Вчера появилось 2 вопроса. Если у Вас ко мне претензии, просьба в ЛС, я Вас внимательно выслушаю.


М-дя, но это ответ на второй вопрос, а где же - на первый?

Кстати, небольшой штришок к вашему бесконфликтому общительному психологическому портрету (этакая вишенка на торте): если уж вы соскучились по хорошим манерам, то отчего же пренебрегли возможностью продемонстрировать их самому: сначала поблагодарить ответивших вам собеседников, и только тогда со смаком затевать разборки со мной?
Словом, благоволите забрать свое замечание, и, не теряя достоинства, удалиться.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Диагностик
сообщение 7.06.2017 - 07:34
Сообщение #11





Группа: Пользователи
Сообщений: 143
Регистрация: 4.09.2012
Пользователь №: 24146



Цитата(kont @ 6.06.2017 - 03:15) *
вообщем я хочу показать что 8-0% случайных значений близки к числу x, остальные далеко

Ну так покажите.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему