Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Сравнение документов

Автор: comisora 7.02.2019 - 13:37

Коллеги, доброго времени суток!

Даны ЮЛ "Рога" и "Копыта", которые предлагают наборы "комплексных решений". Сама суть решения содержится в договорах (персональный манагер, круглосуточная тех.поддержка, сопровождение документообороту по различным условиям и т.п.), некоторые пункты различаются при разных уровнях обслуживания (ВИП-клиентам кофе и шоколадку во время ожидания). Сами данные, понятно, разнородные - часть показателей счётные (количество оформленных бумажек и т.п.), часть - это некоторые условия в текстовой форме с "уникальными" предложениям. Спросили - как можно "объективно" сравнить наборы услуг.

Я подумал, что это из области MCA/PCA/MDS, но не уверен (смущает большое количество разношёрстных условий и предложений). Может быть, кто-то знает литературу в которой можно поискать пример решения схожей задачи или имеет опыт анализа таких данных и готов им поделиться? Предполагаю, что в банковской/страховой/финансовой аналитике такие задачи рассматривались и какие-то способы решения данных задач имеются. Бегло просмотрел CRAN Task Views в разделе финансы и эконометрия, подходящего ничего не нашёл.

Заранее спасибо за советы/рекомендации/предложения/примеры.

Автор: p2004r 7.02.2019 - 15:41

Цитата(comisora @ 7.02.2019 - 13:37) *
Коллеги, доброго времени суток!

Даны ЮЛ "Рога" и "Копыта", которые предлагают наборы "комплексных решений". Сама суть решения содержится в договорах (персональный манагер, круглосуточная тех.поддержка, сопровождение документообороту по различным условиям и т.п.), некоторые пункты различаются при разных уровнях обслуживания (ВИП-клиентам кофе и шоколадку во время ожидания). Сами данные, понятно, разнородные - часть показателей счётные (количество оформленных бумажек и т.п.), часть - это некоторые условия в текстовой форме с "уникальными" предложениям. Спросили - как можно "объективно" сравнить наборы услуг.

Я подумал, что это из области MCA/PCA/MDS, но не уверен (смущает большое количество разношёрстных условий и предложений). Может быть, кто-то знает литературу в которой можно поискать пример решения схожей задачи или имеет опыт анализа таких данных и готов им поделиться? Предполагаю, что в банковской/страховой/финансовой аналитике такие задачи рассматривались и какие-то способы решения данных задач имеются. Бегло просмотрел CRAN Task Views в разделе финансы и эконометрия, подходящего ничего не нашёл.

Заранее спасибо за советы/рекомендации/предложения/примеры.


https://journal.r-project.org/archive/2016/RJ-2016-054/RJ-2016-054.pdf

Автор: passant 7.02.2019 - 16:58

Цитата(comisora @ 7.02.2019 - 12:37) *
Я подумал, что это из области MCA/PCA/MDS

Вообще-то это из области Теории принятия решений. Только там формальные методы формальны настолько,что если просто "сравнить два конкретных предложения" - то огород городить замаетесь (Формирование множества возможных решений, Формирование критериев оценки, Построение индикаторов, Оценка решения по заданным критерием, Функция полезности, Выбор наилучшего решения, Обобщение мнения экспертов, Способы учета неопределенности .... бррррр). Есть даже специальный класс программ - СППР (Системы Поддержки Принятия Решений). Если вдруг собрались глубоко вникать - ну так на математических специальностях (в упрощенном виде - на менеджменте тоже) в университетах на эту тему целые курсы есть, или даже несколько. И учебников - достаточно. Копайте, если надо. Главное - не закопаться wink.gif

Автор: nokh 7.02.2019 - 19:36

Цитата(comisora @ 7.02.2019 - 15:37) *
...Спросили - как можно "объективно" сравнить наборы услуг.
Я подумал, что это из области MCA/PCA/MDS, но не уверен (смущает большое количество разношёрстных условий и предложений)...

Не совсем понятна цель сравнения. Оценить уровень общего сходства наборов или выйти на самые-самые особенности? В любом случае у меня опыта в таком почти нет. В голову приходит прокрустов анализ, который позволяет сравнить многомерные матрицы данных. Его можно применять как исходным данным, так и к редуцированным в ходе MCA/PCA/MDS. В сочетании с рандомизационной процедурой можно оценить статистическую значимость различия двух матриц данных, а также её элементов.

Автор: comisora 8.02.2019 - 19:26

2nokh
Цель, насколько понимаю, очень простая - выбрать "лучшее решение" за меньшие финансовые вложения так, чтобы это было "объективно". В качестве одного из этапов необходим анализ договоров и их сравнение по предлагаемым позициям - что отличается, в что нет.

2passant
Скорее всего, Вы правы и нужно именно это. Спасибо за расширение кругозора.

2p2004r
Спс

Автор: ogurtsov 8.02.2019 - 21:27

Для уникальных предложений можно строить эмбеддинги (векторные представления) и смотреть, насколько они близко расположены в полученном векторном пространстве. Может быть, некоторые окажутся не такими уж и уникальными.

Автор: comisora 1.03.2019 - 22:36

Доброго вечера.
2ogurtsov

Вы про вот этот инструмент писали? https://blogs.rstudio.com/tensorflow/posts/2017-12-22-word-embeddings-with-keras/

Автор: ogurtsov 3.03.2019 - 19:13

Цитата(comisora @ 1.03.2019 - 23:36) *
Доброго вечера.
2ogurtsov

Вы про вот этот инструмент писали? https://blogs.rstudio.com/tensorflow/posts/2017-12-22-word-embeddings-with-keras/

Там на уровне слов работают, но принцип тот же. Можно даже просто усреднять векторные представления слов и получать векторное представление целого текста.
Нервную сетку обучать не обязательно, можно брать обученную модель doc2vec.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)