Здравствуйте, гость ( Вход | Регистрация )
21.08.2017 - 01:08
Сообщение
#1
|
||
|
Группа: Пользователи Сообщений: 18 Регистрация: 9.02.2013 Из: Баку Пользователь №: 24615 |
Здравствуйте, уважаемые форумчане. Как-то даже неловко заходить раз в пятилетку с вопросом. Но как учит С.Гланц -- не стесняйтесь спрашивать). Не могли бы Вы мне помочь с решением, возможно даже очень простой, задачи с процентами. Даже не решить, а подсказать метод или источник где можно найти способ решения. Суть проблемы такова. Вначале взгляните на рисунок:
Так вот. Различные наблюдатели в разных населённых пунктах (условно городах) регистрировали определённые объекты. Объекты классифицированы и обозначены буквами алфавита, регистрировалась их частота в процентах. Сколько всего городов наблюдали указано во втором столбце. Города не повторялись и у каждого наблюдателя был как-бы свой регион. Те объекты, которые не подходили под классификацию регистрировались как "другие" и в таблице не указаны. Поэтому, например, в третьей строке сумма всех процентов 31, то есть 69 не удалось отнести к какому-либо виду. А в третьей строке, наоборот, все объекты подходили под классификацию и в сумме дают 100%. Но цель не в этом. Надо выяснить сколько приблизительно объектов какого-либо типа приходится в целом на страну. В последней строке есть графа %-ты в среднем, вычисленные для объектов вида Д. Так вот, если вычислить такую цифру для всех типов объектов, то в сумме они оказываются более 100%. То есть средние значения процентов не подходят. В целом населённых пунктов (условно городов) по стране очень много, но суммарная цифра уже рассмотренных является как-бы достаточной выборкой для каких-либо выводов. Как исходя из этих данных можно хотя бы как-то высказаться о приблизительном проценте конкретного объекта в N-ом городе (или группе городов). Можно ли как-то аппроксимировать эти значения, чтобы сумма средних процентов была 100%? Я понимаю, был бы график, то можно было бы сгладить его регрессионной функцией или при помощи полинома. Но в данном случае надо выявить тенденцию в виде распределения по долям. Возможно задача банальная, просто я не встречался. Рад был бы узнать Ваше мнение на этот счёт. Заранее благодарю. |
|
|
|
![]() |
![]() |
![]() |
18.08.2018 - 17:25
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 18 Регистрация: 9.02.2013 Из: Баку Пользователь №: 24615 |
[quote name='passant' date='15.08.2018 - 19:49' post='23252']
Ну, от функций принадлежностей до классификации на основе нечетких правил еще как до Луны.... [quote name='100$' date='15.08.2018 - 20:57' post='23253'] Не знаю, passant, не знаю, но, по-видимому, Луна, ближе, чем вы думаете: Спасибо за ответы (впечатляет и небольшая полемика вокруг высказанных мыслей насчёт неё). Но после них у меня тоже ситуация вроде как с Луной) До первого полёта на спутник кто-то из рук. лунного проекта амер. говорил "Привезите мне хотя бы один реголит и я скажу из чего была создана вселенная". Когда привезли он только развёл руками "Увы, вопросов теперь стало ещё больше")). Я полностью разделяю мнение passant, что стоит для начала ознакомиться с азами раздела науки. Но боюсь не тот случай)) Я тут пытался вникнуть в азбуку нечетких классификаций, но увы... Вспомнил, что на восприятие и понимание азов биометрии когда-то ушёл целый семестр с занятиями 3 раза в неделю. Боюсь не осилю. Я медик, но задача которую я решаю не совсем клиническая. В принципе я её описал. Имеется набор признаков характеризующих явление или предмет. Правда характеристики только такого рода, например: известно, что мел в 80% белый, в 70% пористый, в 60% хрупкий и т.д. (около 10 признаков). То есть нечёткие. Обнаружив предмет, допустим белый, не пористый, но хрупкий и т.д. могу ли я оценить степень близости его к мелу? Понятно, что исключить смогу, если он чёрный, не пористый и крепкий. Как товарищи, хорошо разбирающиеся в мире цифр, можете ли мне подсказать как Вы её стали решать? Кластерный анализ, классификация на основе нечетких отношений и т.д. и т.п.? С предложенным способом решения, как-бы уже готовой теоремой, возможно, я не буду уже испытывать таких трудностей. Заранее благодарен. |
|
|
![]() |
![]() |
18.08.2018 - 23:05
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Цитата Я медик, но задача которую я решаю не совсем клиническая. В принципе я её описал. Имеется набор признаков характеризующих явление или предмет. Правда характеристики только такого рода, например: известно, что мел в 80% белый, в 70% пористый, в 60% хрупкий и т.д. (около 10 признаков). То есть нечёткие. Обнаружив предмет, допустим белый, не пористый, но хрупкий и т.д. могу ли я оценить степень близости его к мелу? Понятно, что исключить смогу, если он чёрный, не пористый и крепкий. Как товарищи, хорошо разбирающиеся в мире цифр, можете ли мне подсказать как Вы её стали решать? Кластерный анализ, классификация на основе нечетких отношений и т.д. и т.п.? С предложенным способом решения, как-бы уже готовой теоремой, возможно, я не буду уже испытывать таких трудностей. Заранее благодарен. Здесь нет единственно возможного решения. Я бы предпочел алгоритмы обучения с учителем (кластеризация - это без учителя). |
|
|
![]() |
![]() |
19.08.2018 - 23:06
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 18 Регистрация: 9.02.2013 Из: Баку Пользователь №: 24615 |
Здесь нет единственно возможного решения. Я бы предпочел алгоритмы обучения с учителем (кластеризация - это без учителя). Да, думаю Вы правы. Просмотрел некоторые работы А.П.Ротштейна и С.Д.Штовбы, по идентификациям нелинейных зависимостей, что-то понимаю)), но глубоко лезть боюсь -- завязну). Было бы проще, будь прога какая-то, где можно было подобрать функцию принадлежности, ну и дальше, как Вы выразились, в функцию зарядить эмпирические данные и получить искомую степень принадлежности в виде попадания в градации. Упомянутые авторы пишут, что в среде Матлаб можно строить такие функции. Вы сталкивались с чем-то подобным? Выражаясь проще, можно ли самому разобраться с такими софтами при решении подобных задач или тут без кибернетиков не обойтись? |
|
|
![]() |
![]() |
20.08.2018 - 00:35
Сообщение
#5
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Было бы проще, будь прога какая-то, где можно было подобрать функцию принадлежности,... Упомянутые авторы пишут, что в среде Матлаб можно строить такие функции. Вы сталкивались с чем-то подобным? Выражаясь проще, можно ли самому разобраться с такими софтами при решении подобных задач или тут без кибернетиков не обойтись? Причем здесь какие-то софты, Матлабы, завлабы, кибернетики, анальгетики etc., о мудрейший Идент? Вы по моей ссылке прогуляйтесь. Там под каждым графиком функции принадлежности есть поля для параметров, играясь с которыми можно посмотреть на "степень кривизны" этих функций. Также приведено их аналитическое описание, по которому можно их посчитать хоть на калькуляторе. Первоклассник - и тот не облажается. Вот и моделируйте степень белизны, пористости, хрупкости своего минерала чем-нибудь S-образным, а потом подставляйте в логистическую регрессию и моделируйте логарифм отношения "вероятность наступления события/1-Вероятность наступления события". И тогда уже не вы будете "пить за кибернетикив", а оне за вас. Сообщение отредактировал 100$ - 20.08.2018 - 00:42 |
|
|
![]() |
![]() |
Ident Помогите вычислить процент 21.08.2017 - 01:08
leo_biostat Цитата(Ident @ 21.08.2017 - 01:08) З... 21.08.2017 - 08:36
Ident Цитата(leo_biostat @ 21.08.2017 - 09... 21.08.2017 - 14:46
p2004r Масштабируете каждого из наблюдателей на страну це... 21.08.2017 - 15:48
nokh Цитата(Ident @ 21.08.2017 - 03:08) .... 21.08.2017 - 19:42
Ident Цитата(p2004r @ 21.08.2017 - 16:48) ... 22.08.2017 - 21:47
Ident Доброго дня всем, уважаемые коллеги. Чтобы не созд... 12.08.2018 - 15:51
100$ Цитата(Ident @ 12.08.2018 - 15:51) Д... 13.08.2018 - 00:15
Ident Если это вся информация, которой вы располагаете, ... 13.08.2018 - 18:00
100$ Определенно. 13.08.2018 - 22:52
Ident Определенно.
Я всё таки более оптимистичен в с... 14.08.2018 - 21:23
Ident Цитата(Ident @ 14.08.2018 - 22:23) О... 14.08.2018 - 21:29
passant Цитата(Ident @ 14.08.2018 - 21:23) .... 14.08.2018 - 21:56
100$ >Ident,
нет ничего проще: вся нечеткая теория ... 14.08.2018 - 22:44
Статистик Цитата(100$ @ 14.08.2018 - 22:4... 17.08.2018 - 11:31
100$ Цитата(Статистик @ 17.08.2018 - 11:3... 17.08.2018 - 12:21
Статистик Цитата(100$ @ 17.08.2018 - 12:2... 20.08.2018 - 12:53
100$ Цитата(Статистик @ 20.08.2018 - 12:5... 20.08.2018 - 14:20
Статистик Цитата(100$ @ 20.08.2018 - 14:2... 20.08.2018 - 18:11
100$ ЦитатаС точки зрения применяемости (с прикладной т... 20.08.2018 - 20:59
Статистик Цитата(100$ @ 20.08.2018 - 20:5... 21.08.2018 - 11:00
100$ Цитата(Статистик @ 21.08.2018 - 11:0... 21.08.2018 - 12:44
Ident Цитата(passant @ 14.08.2018 - 22:56)... 15.08.2018 - 14:46
passant Цитата(Ident @ 15.08.2018 - 14:46) С... 15.08.2018 - 17:32
100$ Цитата(Ident @ 15.08.2018 - 14:46) .... 15.08.2018 - 18:13
passant Цитата(100$ @ 15.08.2018 - 18:1... 15.08.2018 - 18:49
100$ Цитата(passant @ 15.08.2018 - 18:49)... 15.08.2018 - 19:57
Ident Цитата(100$ @ 20.08.2018 - 01:3... 20.08.2018 - 13:40
100$ Цитата(Ident @ 20.08.2018 - 13:40) В... 20.08.2018 - 14:25
Ident Приветствую уважаемых участников темы в эти нестаб... 28.06.2020 - 16:05
passant Цитата(Ident @ 28.06.2020 - 16:05) П... 28.06.2020 - 16:51
Ident [quote name='passant' date='28.06.2020... 10.07.2020 - 00:46![]() ![]() |