[发明专利]基于多视角的知识图谱构建方法、装置和计算机设备在审
申请号: | 201811377623.5 | 申请日: | 2018-11-19 |
公开(公告)号: | CN109657066A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 高晓辉;叶素兰;李国才;王芊;何子龙;楼华 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 王宁 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集团企业 视角 关系类型 计算机设备 图谱构建 原始数据 多视角 图谱 标识获取 大数据 角色 构建 直观 申请 | ||
本申请涉及大数据领域的一种基于多视角的知识图谱构建方法、装置和计算机设备。所述方法包括:获取与集团企业标识对应的多个谱系视角;所述谱系视角具有对应的业务定义;根据所述集团企业标识获取相应的原始数据;利用所述业务定义以及所述原始数据,识别每个谱系视角对应的实体以及实体之间的关系类型;对每个谱系视角下的各个实体进行角色划分;根据实体被划分的角色以及实体之间的关系类型,构建与所述集团企业标识对应的多个谱系视角下的知识图谱。采用本方法无需多次操作,即可得到能够直观反映集团企业中多个公司之间不同关系类型的知识图谱。
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于多视角的知识图谱构建方法、装置和计算机设备。
背景技术
集团企业通常包括母公司、分公司、子公司、控股公司、参股公司等多种公司。除了母公司与分公司、子公司、控股公司、参股公司之间具有一定的关系之外,各个分公司、子公司、控股公司、参股公司之间通常也存在千丝万缕的联系。
目前市面上出现了一些网站可以查询到一个公司与其他公司之间关系。公司之间的关系可以通过图谱的方式予以展示。但是这些图谱只是从被查询的这个公司出发,展示与其对应的其他公司之间的投资关系。图谱的视角和维度都较为单一。如果通过这种传统的图谱来查看一个集团企业中所有公司之间的关联关系,则需要针对该集团企业的每家公司分别进行查询。不仅操作繁琐,而且无法直观的反映出该集团企业中各家公司之间的关系。
发明内容
基于此,有必要针对上述技术问题,提供一种无需多次操作,即可得到直观反映集团企业中多个公司之间不同关系类型的知识图谱的基于多视角的知识图谱构建方法、装置和计算机设备。
一种基于多视角的知识图谱构建方法,所述方法包括:
获取与集团企业标识对应的多个谱系视角;所述谱系视角具有对应的业务定义;
根据所述集团企业标识获取相应的原始数据;
利用所述业务定义以及所述原始数据,识别每个谱系视角对应的实体以及实体之间的关系类型;
对每个谱系视角下的各个实体进行角色划分;
根据实体被划分的角色以及实体之间的关系类型,构建与所述集团企业标识对应的多个谱系视角下的知识图谱。
在其中一个实施例中,所述根据所述集团企业标识获取相应的原始数据包括:
获取所述集团企业标识对应的多个公司以及自然人;
通过第三方平台爬取与所述公司以及自然人对应的外部数据,将所述外部数据迁移至大数据平台;
通过本地数据库获取与所述公司以及自然人对应的内部数据,将所述内部数据迁移至大数据平台;
将大数据平台中与所述公司以及自然人对应的内部数据以及外部数据标记为与所述集团标识对应的原始数据。
在其中一个实施例中,所述利用所述业务定义以及所述原始数据,识别每个谱系视角对应的实体以及实体之间的关系类型包括:
根据所述业务定义获取谱系视角对应的企业范围以及关系类型;
将所述企业范围对应的多个公司和/或自然人标记为实体;
获取与所述关系类型对应的关键字,利用所述关键字在所述原始数据中识别每个谱系视角对应的多个实体之间的关系类型。
在其中一个实施例中,所述根据实体被划分的角色以及实体之间的关系类型,构建与所述集团企业标识对应的多个谱系视角下的知识图谱包括:
获取每个谱系视角下被划分角色后的实体;所述被划分角色后的实体包括视角顶点、中间节点以及末端节点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811377623.5/2.html,转载请声明来源钻瓜专利网。