Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Как измерить плотность чисел к числу
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
kont
Коллеги, поясню новый вопрос. Есть случайный ряд чисел, мне нужно понять около какого значения сосредоточено наибольшее число других значений. Как это правильно сделать в R лучше, т.к. SPSS доверия все меньше и меньше (из-за ограниченного функционала)?
ogurtsov
Около - слишком абстрактно. Вся выборка в каком-то смысле "сосредоточена" вокруг среднего/моды/медианы.
Если значения дробные, достаточно просто округлить до некоторого количества знаков после запятой и найти моду.
Можно разбить на интервалы фиксированной длины и посчитать количество значений в каждом из них (построить гистограмму - hist(), результат присвоить переменной и рассмотреть, что там внутри), затем взять интервал с максимальным количеством и найти в нем медиану.
kont
я имел ввиду в плане расстояний. у какого значения кучкуются 80% других значений к примеру.
ogurtsov
Цитата(kont @ 5.06.2017 - 20:43) *
я имел ввиду в плане расстояний. у какого значения кучкуются 80% других значений к примеру.

Кластеризация что ли так странно описана? Ну, сделайте кластеризацию.
kont
я о ней думал, но как корректно сделать ее, чтобы на графике был отображен центр, при том что я кластеризую случайный набор чисел, а не наблюдения
с(4 87 6 0875 87 50 87508 7 5 0875 8655 ....)
kont
вообщем я хочу показать что 8-0% случайных значений близки к числу x, остальные далеко
Простите если невнятно объясняю(
100$
Цитата(kont @ 5.06.2017 - 22:15) *
вообщем я хочу показать что 8-0% случайных значений близки к числу x, остальные далеко
Простите если невнятно объясняю(


Kont, а почему бы вам не создать на форуме одну-единственную персональную тему и с некоторой периодичностью не публиковать там свои вопросы?
Ну, вместо того, чтобы за...(censored)...хламлять форум опусами, которые, судя по статистике просмотров, не интересны никому от слова "вообще"?
passant
Возможно, не совсем понял глубину задачи, но рискну вставить свои пять копеек.
Если я правильно понял - у Вас есть выборка чисел, не важно как она получена. Вы хотите найти ответ на вопрос - как найти среди всех чисел такие, у которых в некоторой (фиксированной ??) окрестности которых находится максимальное количество точек выборки.
Если это так - то упорядочиваете все свои числа. Затем циклом проходитесь по всем ним. Для каждого числа Xi считаете, сколько других точек находятся в интервале [Xi-A,Xi+A].
Получили новый ряд. Максимальное значение этого ряда и есть точка, вокруг которой "кучкуется" максимальное количество других точек. Можно график построить. В случае потребности - можно "поиграть" с выбором числа А.
В многомерном случае все будет, конечно, сложнее. Но если Ваши данные числовые, если функция расстояния для каждой из координат одна и та-же, то особых проблем возникнуть не должно.
Собственно, это некоторый простейший алгоритм кластеризации. В случае обнаружения нескольких точек "максимального скопления" - у Вас могут подучиться несколько кластеров. Ну, значит, такие у Вас данные.
Или я что-то упустил в постановке задачи?
kont
100$, смените тон общения. Я не собираюсь Вас учить грамматике общения, да и образование у меня не психологическое, но с людьми много общаюсь и могу Вам сказать, чтобы Вы последили за своей речью. Она носит конфликтогенный характер. Скрытая транзакция("Ху(cencored) тут расписался своими сообщениями"). Мне такой тон не нравится, и я имею право об этом говорить. Ваша природная язвительность тут неуместна. Вы возможно меня старше, Вашего возраста я не знаю, но я делаю Вам замечание. Вы можете тактично молчать. Я прошу к этому аспекту просто не возвращаться. Я задаю вопросы не для флуда, чтобы Вы не беспокоились. К тому же не так-то часто я пишу. Вчера появилось 2 вопроса. Если у Вас ко мне претензии, просьба в ЛС, я Вас внимательно выслушаю.
100$
Цитата(kont @ 6.06.2017 - 18:48) *
100$, смените тон общения. Я не собираюсь Вас учить грамматике общения, да и образование у меня не психологическое, но с людьми много общаюсь и могу Вам сказать, чтобы Вы последили за своей речью. Она носит конфликтогенный характер. Скрытая транзакция("Ху(cencored) тут расписался своими сообщениями"). Мне такой тон не нравится, и я имею право об этом говорить. Ваша природная язвительность тут неуместна. Вы возможно меня старше, Вашего возраста я не знаю, но я делаю Вам замечание. Вы можете тактично молчать. Я прошу к этому аспекту просто не возвращаться. Я задаю вопросы не для флуда, чтобы Вы не беспокоились. К тому же не так-то часто я пишу. Вчера появилось 2 вопроса. Если у Вас ко мне претензии, просьба в ЛС, я Вас внимательно выслушаю.


М-дя, но это ответ на второй вопрос, а где же - на первый?

Кстати, небольшой штришок к вашему бесконфликтому общительному психологическому портрету (этакая вишенка на торте): если уж вы соскучились по хорошим манерам, то отчего же пренебрегли возможностью продемонстрировать их самому: сначала поблагодарить ответивших вам собеседников, и только тогда со смаком затевать разборки со мной?
Словом, благоволите забрать свое замечание, и, не теряя достоинства, удалиться.
Диагностик
Цитата(kont @ 6.06.2017 - 03:15) *
вообщем я хочу показать что 8-0% случайных значений близки к числу x, остальные далеко

Ну так покажите.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.