Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Как измерить плотность чисел к числу

Автор: kont 5.06.2017 - 19:18

Коллеги, поясню новый вопрос. Есть случайный ряд чисел, мне нужно понять около какого значения сосредоточено наибольшее число других значений. Как это правильно сделать в R лучше, т.к. SPSS доверия все меньше и меньше (из-за ограниченного функционала)?

Автор: ogurtsov 5.06.2017 - 20:30

Около - слишком абстрактно. Вся выборка в каком-то смысле "сосредоточена" вокруг среднего/моды/медианы.
Если значения дробные, достаточно просто округлить до некоторого количества знаков после запятой и найти моду.
Можно разбить на интервалы фиксированной длины и посчитать количество значений в каждом из них (построить гистограмму - hist(), результат присвоить переменной и рассмотреть, что там внутри), затем взять интервал с максимальным количеством и найти в нем медиану.

Автор: kont 5.06.2017 - 20:43

я имел ввиду в плане расстояний. у какого значения кучкуются 80% других значений к примеру.

Автор: ogurtsov 5.06.2017 - 20:55

Цитата(kont @ 5.06.2017 - 20:43) *
я имел ввиду в плане расстояний. у какого значения кучкуются 80% других значений к примеру.

Кластеризация что ли так странно описана? Ну, сделайте кластеризацию.

Автор: kont 5.06.2017 - 22:13

я о ней думал, но как корректно сделать ее, чтобы на графике был отображен центр, при том что я кластеризую случайный набор чисел, а не наблюдения
с(4 87 6 0875 87 50 87508 7 5 0875 8655 ....)

Автор: kont 5.06.2017 - 22:15

вообщем я хочу показать что 8-0% случайных значений близки к числу x, остальные далеко
Простите если невнятно объясняю(

Автор: 100$ 5.06.2017 - 23:24

Цитата(kont @ 5.06.2017 - 22:15) *
вообщем я хочу показать что 8-0% случайных значений близки к числу x, остальные далеко
Простите если невнятно объясняю(


Kont, а почему бы вам не создать на форуме одну-единственную персональную тему и с некоторой периодичностью не публиковать там свои вопросы?
Ну, вместо того, чтобы за...(censored)...хламлять форум опусами, которые, судя по статистике просмотров, не интересны никому от слова "вообще"?

Автор: passant 6.06.2017 - 10:49

Возможно, не совсем понял глубину задачи, но рискну вставить свои пять копеек.
Если я правильно понял - у Вас есть выборка чисел, не важно как она получена. Вы хотите найти ответ на вопрос - как найти среди всех чисел такие, у которых в некоторой (фиксированной ??) окрестности которых находится максимальное количество точек выборки.
Если это так - то упорядочиваете все свои числа. Затем циклом проходитесь по всем ним. Для каждого числа Xi считаете, сколько других точек находятся в интервале [Xi-A,Xi+A].
Получили новый ряд. Максимальное значение этого ряда и есть точка, вокруг которой "кучкуется" максимальное количество других точек. Можно график построить. В случае потребности - можно "поиграть" с выбором числа А.
В многомерном случае все будет, конечно, сложнее. Но если Ваши данные числовые, если функция расстояния для каждой из координат одна и та-же, то особых проблем возникнуть не должно.
Собственно, это некоторый простейший алгоритм кластеризации. В случае обнаружения нескольких точек "максимального скопления" - у Вас могут подучиться несколько кластеров. Ну, значит, такие у Вас данные.
Или я что-то упустил в постановке задачи?

Автор: kont 6.06.2017 - 18:48

100$, смените тон общения. Я не собираюсь Вас учить грамматике общения, да и образование у меня не психологическое, но с людьми много общаюсь и могу Вам сказать, чтобы Вы последили за своей речью. Она носит конфликтогенный характер. Скрытая транзакция("Ху(cencored) тут расписался своими сообщениями"). Мне такой тон не нравится, и я имею право об этом говорить. Ваша природная язвительность тут неуместна. Вы возможно меня старше, Вашего возраста я не знаю, но я делаю Вам замечание. Вы можете тактично молчать. Я прошу к этому аспекту просто не возвращаться. Я задаю вопросы не для флуда, чтобы Вы не беспокоились. К тому же не так-то часто я пишу. Вчера появилось 2 вопроса. Если у Вас ко мне претензии, просьба в ЛС, я Вас внимательно выслушаю.

Автор: 100$ 7.06.2017 - 01:07

Цитата(kont @ 6.06.2017 - 18:48) *
100$, смените тон общения. Я не собираюсь Вас учить грамматике общения, да и образование у меня не психологическое, но с людьми много общаюсь и могу Вам сказать, чтобы Вы последили за своей речью. Она носит конфликтогенный характер. Скрытая транзакция("Ху(cencored) тут расписался своими сообщениями"). Мне такой тон не нравится, и я имею право об этом говорить. Ваша природная язвительность тут неуместна. Вы возможно меня старше, Вашего возраста я не знаю, но я делаю Вам замечание. Вы можете тактично молчать. Я прошу к этому аспекту просто не возвращаться. Я задаю вопросы не для флуда, чтобы Вы не беспокоились. К тому же не так-то часто я пишу. Вчера появилось 2 вопроса. Если у Вас ко мне претензии, просьба в ЛС, я Вас внимательно выслушаю.


М-дя, но это ответ на второй вопрос, а где же - на первый?

Кстати, небольшой штришок к вашему бесконфликтому общительному психологическому портрету (этакая вишенка на торте): если уж вы соскучились по хорошим манерам, то отчего же пренебрегли возможностью продемонстрировать их самому: сначала поблагодарить ответивших вам собеседников, и только тогда со смаком затевать разборки со мной?
Словом, благоволите забрать свое замечание, и, не теряя достоинства, удалиться.

Автор: Диагностик 7.06.2017 - 07:34

Цитата(kont @ 6.06.2017 - 03:15) *
вообщем я хочу показать что 8-0% случайных значений близки к числу x, остальные далеко

Ну так покажите.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)