![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 15.10.2017 Пользователь №: 30359 ![]() |
Приветствую всех, моя тема косвенно связано с медицинской. а именно в случае медстраховки.
Подскажите, а можно ли в R методом теории графов найти зависимости между 2-мя людьми, как в этом датасете, например найти связи между одинаковыми фамилиями?
Прикрепленные файлы
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
Приветствую всех, моя тема косвенно связано с медицинской. а именно в случае медстраховки. Подскажите, а можно ли в R методом теории графов найти зависимости между 2-мя людьми, как в этом датасете, например найти связи между одинаковыми фамилиями? Слинковать не трудно даже базовыми средствами R. Код df.data <- read.csv2("data.csv", stringsAsFactors = F) merge(data.frame(fio=gsub("^([^ ]+).*", "\\1", df.data[,2]), stringsAsFactors = F) , data.frame(fio=gsub("^([^ ]+).*", "\\1", df.data[,3]), stringsAsFactors = F)) fio 1 Dorofeeva 2 Dorofeeva 3 Dorofeeva 4 Dorofeeva 5 Dorofeeva 6 Dorofeeva 7 Komin 8 Korobov 9 Kotova 10 Kotova 11 Kozlov 12 Mamontov 13 Mamontov 14 Pavlova 15 Pavlova 16 Rogachev 17 Soloviev 18 Vorobyov 19 Vorobyov Есть record linkage средства в списке пакетов. Готовых функций преобразования имен в отчества и т.п. нет. Визуализация делается library(igraph). Но обычно средства "интеллектуальной разведки" вокруг RDF баз всяких базируются. Старинный RelFinder на флеше написанный подключается к sparql точке (на какмлибо триплесторе поднятой) куда загружаются слинкованные таблицы (R умеет в SPARQL) и уже в нем ищут "цепочки фактов". ![]() |
|
![]() |
![]() |
![]() ![]() |