Здравствуйте, гость ( Вход | Регистрация )
21.08.2017 - 01:08
Сообщение
#1
|
||
|
Группа: Пользователи Сообщений: 18 Регистрация: 9.02.2013 Из: Баку Пользователь №: 24615 |
Здравствуйте, уважаемые форумчане. Как-то даже неловко заходить раз в пятилетку с вопросом. Но как учит С.Гланц -- не стесняйтесь спрашивать). Не могли бы Вы мне помочь с решением, возможно даже очень простой, задачи с процентами. Даже не решить, а подсказать метод или источник где можно найти способ решения. Суть проблемы такова. Вначале взгляните на рисунок:
Так вот. Различные наблюдатели в разных населённых пунктах (условно городах) регистрировали определённые объекты. Объекты классифицированы и обозначены буквами алфавита, регистрировалась их частота в процентах. Сколько всего городов наблюдали указано во втором столбце. Города не повторялись и у каждого наблюдателя был как-бы свой регион. Те объекты, которые не подходили под классификацию регистрировались как "другие" и в таблице не указаны. Поэтому, например, в третьей строке сумма всех процентов 31, то есть 69 не удалось отнести к какому-либо виду. А в третьей строке, наоборот, все объекты подходили под классификацию и в сумме дают 100%. Но цель не в этом. Надо выяснить сколько приблизительно объектов какого-либо типа приходится в целом на страну. В последней строке есть графа %-ты в среднем, вычисленные для объектов вида Д. Так вот, если вычислить такую цифру для всех типов объектов, то в сумме они оказываются более 100%. То есть средние значения процентов не подходят. В целом населённых пунктов (условно городов) по стране очень много, но суммарная цифра уже рассмотренных является как-бы достаточной выборкой для каких-либо выводов. Как исходя из этих данных можно хотя бы как-то высказаться о приблизительном проценте конкретного объекта в N-ом городе (или группе городов). Можно ли как-то аппроксимировать эти значения, чтобы сумма средних процентов была 100%? Я понимаю, был бы график, то можно было бы сгладить его регрессионной функцией или при помощи полинома. Но в данном случае надо выявить тенденцию в виде распределения по долям. Возможно задача банальная, просто я не встречался. Рад был бы узнать Ваше мнение на этот счёт. Заранее благодарю. |
|
|
|
![]() |
![]() |
![]() |
13.08.2018 - 22:52
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Определенно.
|
|
|
![]() |
![]() |
14.08.2018 - 21:23
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 18 Регистрация: 9.02.2013 Из: Баку Пользователь №: 24615 |
Определенно.
Я всё таки более оптимистичен в своих ожиданиях, ибо что-то подобное медики решали, правда, не совсем "традиционными" в таких случаях математическими приёмами (в работе, которую я читал, вскользь упоминалось об аппарате размытой логики). Честно говоря, в описанном мной случае пример с дождём очень неудачный вышел. Мой косяк, каюсь). Постараюсь передать суть в несколько другом изложении: Геолог ищет минералы. На данной территории встречается 20 разных минералов (или допустим 50, не суть, просто отмечаю, что небольшая цифра в целом). Каждый минерал имеет описание свойств, но не совсем конкретное. Например, если это мел, то цвет не указывается точно белый, а говорится, мол, чаще белый (допустим в 75%), реже бежевый (20%) и иногда светло-серый (5%). И таких вот физических свойств (кроме цвета, там плотность, блеск, форма и т.д.) у каждого камня допустим 10-12 (не более). Геолога интересует только мел, поэтому свойства других минералов ему не интересны. Обнаружив очередной камень, он фиксирует свои визуальные наблюдения насчёт цвета, плотности и т.д. Понятно, что человек как-то (может даже иррационально) сразу распознаёт искомый объект, не зацикливаясь на логике, но в данном случае интересен именно алгоритм поиска, а не какие-то минералы)). Теперь собственно задача. У геолога два потока информации ? один академический из книги о меле, а другой из его записей. Есть ли способ оценить меру близости между этими данными? То есть можно ли построить мат.модель, которая на основании подобных данных сможет выдавать процент (вероятность) соответствия наблюдаемых показателей уже известным. Результат модели необязательно должен быть в конкретных цифрах. Приемлемы могут быть ответы и такого рода, например ? 1)точно мел, 2)скорее всего, мел, 3)не исключено, что мел, 4) скорее всего не мел, 5)точно не мел. То есть в виде степени соответствия или исключения. Вот как-бы такая задача. Заранее благодарен за мнения. |
|
|
![]() |
![]() |
14.08.2018 - 21:29
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 18 Регистрация: 9.02.2013 Из: Баку Пользователь №: 24615 |
Определенно. Я всё таки более оптимистичен в своих ожиданиях, ибо что-то подобное медики решали, правда, не совсем "традиционными" в таких случаях математическими приёмами (в работе, которую я читал, вскользь упоминалось об аппарате размытой логики). Честно говоря, в описанном мной случае пример с дождём очень неудачный вышел. Мой косяк, каюсь). Постараюсь передать суть в несколько другом изложении: Геолог ищет минералы. На данной территории встречается 20 разных минералов (или допустим 50, не суть, просто отмечаю, что небольшая цифра в целом). Каждый минерал имеет описание свойств, но не совсем конкретное. Например, если это мел, то цвет не указывается точно белый, а говорится, мол, чаще белый (допустим в 75%), реже бежевый (20%) и иногда светло-серый (5%). И таких вот физических свойств (кроме цвета, там плотность, блеск, форма и т.д.) у каждого камня допустим 10-12 (не более). Геолога интересует только мел, поэтому свойства других минералов ему не интересны. Обнаружив очередной камень, он фиксирует свои визуальные наблюдения насчёт цвета, плотности и т.д. Понятно, что человек как-то (может даже иррационально) сразу распознаёт искомый объект, не зацикливаясь на логике, но в данном случае интересен именно алгоритм поиска, а не какие-то минералы)). Теперь собственно задача. У геолога два потока информации ? один академический из книги о меле, а другой из его записей. Есть ли способ оценить меру близости между этими данными? То есть можно ли построить мат.модель, которая на основании подобных данных сможет выдавать процент (вероятность) соответствия наблюдаемых показателей уже известным. Результат модели необязательно должен быть в конкретных цифрах. Приемлемы могут быть ответы и такого рода, например ? 1)точно мел, 2)скорее всего, мел, 3)не исключено, что мел, 4) скорее всего не мел, 5)точно не мел. То есть в виде степени соответствия или исключения. Вот как-бы такая задача. Заранее благодарен за мнения. Очень интересно узнать мнение уважаемого Nokha). Сообщение отредактировал Ident - 14.08.2018 - 21:31 |
|
|
![]() |
![]() |
Ident Помогите вычислить процент 21.08.2017 - 01:08
leo_biostat Цитата(Ident @ 21.08.2017 - 01:08) З... 21.08.2017 - 08:36
Ident Цитата(leo_biostat @ 21.08.2017 - 09... 21.08.2017 - 14:46
p2004r Масштабируете каждого из наблюдателей на страну це... 21.08.2017 - 15:48
nokh Цитата(Ident @ 21.08.2017 - 03:08) .... 21.08.2017 - 19:42
Ident Цитата(p2004r @ 21.08.2017 - 16:48) ... 22.08.2017 - 21:47
Ident Доброго дня всем, уважаемые коллеги. Чтобы не созд... 12.08.2018 - 15:51
100$ Цитата(Ident @ 12.08.2018 - 15:51) Д... 13.08.2018 - 00:15
Ident Если это вся информация, которой вы располагаете, ... 13.08.2018 - 18:00
passant Цитата(Ident @ 14.08.2018 - 21:23) .... 14.08.2018 - 21:56
100$ >Ident,
нет ничего проще: вся нечеткая теория ... 14.08.2018 - 22:44
Статистик Цитата(100$ @ 14.08.2018 - 22:4... 17.08.2018 - 11:31
100$ Цитата(Статистик @ 17.08.2018 - 11:3... 17.08.2018 - 12:21
Статистик Цитата(100$ @ 17.08.2018 - 12:2... 20.08.2018 - 12:53
100$ Цитата(Статистик @ 20.08.2018 - 12:5... 20.08.2018 - 14:20
Статистик Цитата(100$ @ 20.08.2018 - 14:2... 20.08.2018 - 18:11
100$ ЦитатаС точки зрения применяемости (с прикладной т... 20.08.2018 - 20:59
Статистик Цитата(100$ @ 20.08.2018 - 20:5... 21.08.2018 - 11:00
100$ Цитата(Статистик @ 21.08.2018 - 11:0... 21.08.2018 - 12:44
Ident Цитата(passant @ 14.08.2018 - 22:56)... 15.08.2018 - 14:46
passant Цитата(Ident @ 15.08.2018 - 14:46) С... 15.08.2018 - 17:32
100$ Цитата(Ident @ 15.08.2018 - 14:46) .... 15.08.2018 - 18:13
passant Цитата(100$ @ 15.08.2018 - 18:1... 15.08.2018 - 18:49
100$ Цитата(passant @ 15.08.2018 - 18:49)... 15.08.2018 - 19:57
Ident [quote name='passant' date='15.08.2018... 18.08.2018 - 17:25
100$ ЦитатаЯ медик, но задача которую я решаю не совсем... 18.08.2018 - 23:05
Ident Цитата(100$ @ 19.08.2018 - 00:0... 19.08.2018 - 23:06
100$ Цитата(Ident @ 19.08.2018 - 23:06) Б... 20.08.2018 - 00:35
Ident Цитата(100$ @ 20.08.2018 - 01:3... 20.08.2018 - 13:40
100$ Цитата(Ident @ 20.08.2018 - 13:40) В... 20.08.2018 - 14:25
Ident Приветствую уважаемых участников темы в эти нестаб... 28.06.2020 - 16:05
passant Цитата(Ident @ 28.06.2020 - 16:05) П... 28.06.2020 - 16:51
Ident [quote name='passant' date='28.06.2020... 10.07.2020 - 00:46![]() ![]() |