[发明专利]一种构建知识图谱的方法、装置、计算机存储介质及终端在审

专利信息
申请号: 202010076035.9 申请日: 2020-01-23
公开(公告)号: CN111241213A 公开(公告)日: 2020-06-05
发明(设计)人: 张杰;袁杰;邓礼志;于皓;吴信东 申请(专利权)人: 北京明略软件系统有限公司
主分类号: G06F16/28 分类号: G06F16/28;G06F16/36;G06F40/258;G06F40/242
代理公司: 北京安信方达知识产权代理有限公司 11262 代理人: 王康;栗若木
地址: 100084 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 构建 知识 图谱 方法 装置 计算机 存储 介质 终端
【说明书】:

一种构建知识图谱的方法、装置、计算机存储介质及终端,包括:将一种或一种以上源数据,根据主题整理为主题域数据;根据整理获得的主题域数据构建主题域图谱;从构建的主题域图谱中获取对应于各应用的图数据库数据,并根据获取的图数据库数据构建各应用的应用知识图谱;其中,所述主题域数据包括:关系主题域数据和实体主题域数据。本发明实施例降低了源数据与构建的知识图谱的耦合性,提升了应用知识图谱的构建效率。

技术领域

本文涉及但不限于知识图谱技术,尤指一种构建知识图谱的方法、装置、计算机存储介质及终端。

背景技术

随着数字化转型,包括银行、保险和证券等大中型金融机构基本已经完成了数据仓库和数据集市的建设。主流的数据仓库实施方案中,将来自不同业务源的数据打散后,根据主题重新进行组织;以银行业为例,使用的主题包括:当事人、产品、协议、事件、资产、财务、机构、地域、营销及渠道等。数据仓库的结构稳定,但缺乏灵活性。为了灵活应对各种业务场景的应用任务,在数据仓库之上还要开发数据集市,直接面向应用。

然而,在一些需要对数据之间的关联关系做深层挖掘的应用场景中,上述数据仓库和数据集市的查询效率很低;比如查询信用卡客户三度以上的人脉关系、查询对公客户三度以上的股权关系(一度公司为A公司、则二度公司为A公司投资的B公司、三度公司为B公司控股的C公司)等;在做深层次关联查询时,该方法查询效率低;假设数据库里有A:姓名-身份证对应表、 B:配偶关系表和C:父母关系表三张表,每张表都有100万行;则查张三的丈母娘是谁时,需要A-B-C-A的三层查询,每层都要从100万行里找一行,查询的总条目数为:100万*100万*100万;当记录关联关系的表的条目数量达到千万量级时,三度人脉以上关联关系的查询几乎无法实现。

目前,相关技术主要通过引入知识图谱来提升关联关系的查询效率;一般的,通过为特定应用建立专属的知识图谱,以图数据库的方式存储关联关系数据后,进行信息查询。此种方案构建的知识图谱与源系统的耦合性太强,源系统的数据类型发生变化后,建立的知识图谱也要随之调整。如何降低源系统与知识图谱的耦合,提供一种耦合性低的知识图谱的构建方法,成为有待解决的一个技术问题。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本发明实施例提供一种构建知识图谱的方法、装置、计算机存储介质及终端,能够降低源数据与构建的知识图谱的耦合性。

本发明实施例提供了一种构建知识图谱的方法,包括:

将一种或一种以上源数据,根据主题整理为主题域数据;

根据整理获得的主题域数据构建主题域图谱;

从构建的主题域图谱中获取对应于各应用的图数据库数据,并根据获取的图数据库数据构建各应用的应用知识图谱;

其中,所述主题域数据包括:关系主题域数据和实体主题域数据。

在一种示例性实施例中,所述根据主题整理为主题域数据,包括:

将所述源数据根据主题进行拆分;

将根据主题拆分获得的数据进行汇总处理后,获得所述主题域数据;

其中,所述主题包括根据以下一项或任意组合的因素拆分的主题:人物、事件、地点、物体及组织。

在一种示例性实施例中,所述根据整理获得的主题域数据构建主题域图谱,包括:

将所述主题域数据按照预设的三元组结构进行存储;

根据按照三元组结构存储的数据,构建所述主题域图谱;

其中,所述三元组结构包括:根据业务关联关系设置的数据结构。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010076035.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top