Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Помогите вычислить процент, необходимо дать оценку процентному распределению явлений (объектов)
Ident
сообщение 21.08.2017 - 01:08
Сообщение #1





Группа: Пользователи
Сообщений: 18
Регистрация: 9.02.2013
Из: Баку
Пользователь №: 24615



Здравствуйте, уважаемые форумчане. Как-то даже неловко заходить раз в пятилетку с вопросом. Но как учит С.Гланц -- не стесняйтесь спрашивать). Не могли бы Вы мне помочь с решением, возможно даже очень простой, задачи с процентами. Даже не решить, а подсказать метод или источник где можно найти способ решения. Суть проблемы такова. Вначале взгляните на рисунок:

Прикрепленное изображение


Так вот. Различные наблюдатели в разных населённых пунктах (условно городах) регистрировали определённые объекты. Объекты классифицированы и обозначены буквами алфавита, регистрировалась их частота в процентах. Сколько всего городов наблюдали указано во втором столбце. Города не повторялись и у каждого наблюдателя был как-бы свой регион. Те объекты, которые не подходили под классификацию регистрировались как "другие" и в таблице не указаны. Поэтому, например, в третьей строке сумма всех процентов 31, то есть 69 не удалось отнести к какому-либо виду. А в третьей строке, наоборот, все объекты подходили под классификацию и в сумме дают 100%. Но цель не в этом. Надо выяснить сколько приблизительно объектов какого-либо типа приходится в целом на страну. В последней строке есть графа %-ты в среднем, вычисленные для объектов вида Д. Так вот, если вычислить такую цифру для всех типов объектов, то в сумме они оказываются более 100%. То есть средние значения процентов не подходят. В целом населённых пунктов (условно городов) по стране очень много, но суммарная цифра уже рассмотренных является как-бы достаточной выборкой для каких-либо выводов. Как исходя из этих данных можно хотя бы как-то высказаться о приблизительном проценте конкретного объекта в N-ом городе (или группе городов). Можно ли как-то аппроксимировать эти значения, чтобы сумма средних процентов была 100%? Я понимаю, был бы график, то можно было бы сгладить его регрессионной функцией или при помощи полинома. Но в данном случае надо выявить тенденцию в виде распределения по долям. Возможно задача банальная, просто я не встречался. Рад был бы узнать Ваше мнение на этот счёт. Заранее благодарю.
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 21.08.2017 - 19:42
Сообщение #2





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Ident @ 21.08.2017 - 03:08) *
... Различные наблюдатели в разных населённых пунктах (условно городах) регистрировали определённые объекты. Объекты классифицированы и обозначены буквами алфавита, регистрировалась их частота в процентах. Сколько всего городов наблюдали указано во втором столбце. Города не повторялись и у каждого наблюдателя был как-бы свой регион. Те объекты, которые не подходили под классификацию регистрировались как "другие" и в таблице не указаны. Поэтому, например, в третьей строке сумма всех процентов 31, то есть 69 не удалось отнести к какому-либо виду. А в третьей строке, наоборот, все объекты подходили под классификацию и в сумме дают 100%. Но цель не в этом. Надо выяснить сколько приблизительно объектов какого-либо типа приходится в целом на страну. В последней строке есть графа %-ты в среднем, вычисленные для объектов вида Д. Так вот, если вычислить такую цифру для всех типов объектов, то в сумме они оказываются более 100%. То есть средние значения процентов не подходят. В целом населённых пунктов (условно городов) по стране очень много, но суммарная цифра уже рассмотренных является как-бы достаточной выборкой для каких-либо выводов. Как исходя из этих данных можно хотя бы как-то высказаться о приблизительном проценте конкретного объекта в N-ом городе (или группе городов). Можно ли как-то аппроксимировать эти значения, чтобы сумма средних процентов была 100%? Я понимаю, был бы график, то можно было бы сгладить его регрессионной функцией или при помощи полинома. Но в данном случае надо выявить тенденцию в виде распределения по долям. Возможно задача банальная, просто я не встречался. Рад был бы узнать Ваше мнение на этот счёт. Заранее благодарю.

1. У Маши было 4 яблока, у Пети - 2 яблока, а у Коли - ни одного (0 яблок). Сколько в среднем яблок было у детей? Согласно вашей логике - (4+2)/2=3. А Коля - неудачник и нам не нужен. Правильный ответ: (4+2+0)/3=2. Поэтому во всех колонках (ну или во всех, где есть хотя бы одно значение) вместо пустых ячеек проставьте нули.

2. Сходная ошибка: раз "Другие" объекты фиксировались и учитывались при расчёте процентов (!), колонка "Другие" должна с необходимостью присутствовать в таблице. Поэтому добавьте такую колонку и рассчитайте % в ней.

3. Ну а теперь можно находить средние. Прикрепил файл с расчётом. Т.о. "задача банальная, просто я не встречался"

4. Сразу бросается в глаза, что данные сильно неоднородны (это можно пытаться доказать статистически, имея полные данные в штуках, а не в % ). Поэтому, строго говоря, сомнительна сама правомочность нахождения средних по всей стране. Возможно, правильнее будет разбить регионы на более однородные группы и посчитать средние уже в них. Если в качестве расстояния между регионами использовать соотношение процентов разных объектов, то можно применить кластерный анализ с использованием в качестве индекса сходства корреляции, например - Спирмена. Поскольку для n=11 и альфа=0,05 критическое значение коэффициента корреляции Спирмена = 0,527, все ветвления на дендрограмме, большие этого числа, можно считать неслучайными (это - упрощение, но близко к правде). Можно его же использовать для выделения кластеров. Режем ветви на уровне 0,527. Получается 4 непохожих друг на друга группы регионов: (9), (8), (3+6), (остальные).

Сообщение отредактировал nokh - 21.08.2017 - 19:52
Прикрепленные файлы
Прикрепленный файл  percent.rar ( 4,74 килобайт ) Кол-во скачиваний: 829
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Ident   Помогите вычислить процент   21.08.2017 - 01:08
- - leo_biostat   Цитата(Ident @ 21.08.2017 - 01:08) З...   21.08.2017 - 08:36
|- - Ident   Цитата(leo_biostat @ 21.08.2017 - 09...   21.08.2017 - 14:46
- - p2004r   Масштабируете каждого из наблюдателей на страну це...   21.08.2017 - 15:48
- - nokh   Цитата(Ident @ 21.08.2017 - 03:08) ....   21.08.2017 - 19:42
- - Ident   Цитата(p2004r @ 21.08.2017 - 16:48) ...   22.08.2017 - 21:47
- - Ident   Доброго дня всем, уважаемые коллеги. Чтобы не созд...   12.08.2018 - 15:51
|- - 100$   Цитата(Ident @ 12.08.2018 - 15:51) Д...   13.08.2018 - 00:15
|- - Ident   Если это вся информация, которой вы располагаете, ...   13.08.2018 - 18:00
- - 100$   Определенно.   13.08.2018 - 22:52
|- - Ident   Определенно. Я всё таки более оптимистичен в с...   14.08.2018 - 21:23
|- - Ident   Цитата(Ident @ 14.08.2018 - 22:23) О...   14.08.2018 - 21:29
|- - passant   Цитата(Ident @ 14.08.2018 - 21:23) ....   14.08.2018 - 21:56
- - 100$   >Ident, нет ничего проще: вся нечеткая теория ...   14.08.2018 - 22:44
|- - Статистик   Цитата(100$ @ 14.08.2018 - 22:4...   17.08.2018 - 11:31
|- - 100$   Цитата(Статистик @ 17.08.2018 - 11:3...   17.08.2018 - 12:21
|- - Статистик   Цитата(100$ @ 17.08.2018 - 12:2...   20.08.2018 - 12:53
|- - 100$   Цитата(Статистик @ 20.08.2018 - 12:5...   20.08.2018 - 14:20
|- - Статистик   Цитата(100$ @ 20.08.2018 - 14:2...   20.08.2018 - 18:11
|- - 100$   ЦитатаС точки зрения применяемости (с прикладной т...   20.08.2018 - 20:59
|- - Статистик   Цитата(100$ @ 20.08.2018 - 20:5...   21.08.2018 - 11:00
|- - 100$   Цитата(Статистик @ 21.08.2018 - 11:0...   21.08.2018 - 12:44
- - Ident   Цитата(passant @ 14.08.2018 - 22:56)...   15.08.2018 - 14:46
|- - passant   Цитата(Ident @ 15.08.2018 - 14:46) С...   15.08.2018 - 17:32
|- - 100$   Цитата(Ident @ 15.08.2018 - 14:46) ....   15.08.2018 - 18:13
|- - passant   Цитата(100$ @ 15.08.2018 - 18:1...   15.08.2018 - 18:49
|- - 100$   Цитата(passant @ 15.08.2018 - 18:49)...   15.08.2018 - 19:57
- - Ident   [quote name='passant' date='15.08.2018...   18.08.2018 - 17:25
|- - 100$   ЦитатаЯ медик, но задача которую я решаю не совсем...   18.08.2018 - 23:05
|- - Ident   Цитата(100$ @ 19.08.2018 - 00:0...   19.08.2018 - 23:06
|- - 100$   Цитата(Ident @ 19.08.2018 - 23:06) Б...   20.08.2018 - 00:35
|- - Ident   Цитата(100$ @ 20.08.2018 - 01:3...   20.08.2018 - 13:40
|- - 100$   Цитата(Ident @ 20.08.2018 - 13:40) В...   20.08.2018 - 14:25
- - Ident   Приветствую уважаемых участников темы в эти нестаб...   28.06.2020 - 16:05
- - passant   Цитата(Ident @ 28.06.2020 - 16:05) П...   28.06.2020 - 16:51
- - Ident   [quote name='passant' date='28.06.2020...   10.07.2020 - 00:46


Добавить ответ в эту темуОткрыть тему