[发明专利]知识图谱构建方法、装置、电子设备及存储介质有效
申请号: | 202010947237.6 | 申请日: | 2020-09-10 |
公开(公告)号: | CN111813963B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 马旋;赵媛媛;罗帆;纪文武 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31;G06F16/33 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 构建 方法 装置 电子设备 存储 介质 | ||
本发明涉及大数据技术,揭露一种知识图谱构建方法,包括:提取原始数据集中实体信息和相关关系,根据所述实体信息和相关关系创建节点属性和节点关系;解析所述原始数据集对应的业务数据表,得到表头信息集;将所述表头信息集与所述节点属性及节点关系通过实体链接分别对应,得到节点属性值以及节点关系值,汇总所述节点属性值以及节点关系值得到解析值集;根据所述解析值集及预先构建的图查询语句模板,得到标准图查询语句,根据所述标准图查询语句,得到知识图谱。此外,本发明还涉及区块链技术,所述原始数据集可来自于区块链的节点中。本发明还提出一种知识图谱构建装置、电子设备以及存储介质。本发明可以降低知识图谱构建的门槛。
技术领域
本发明涉及大数据技术领域,尤其涉及一种知识图谱构建方法、装置、电子设备及计算机可读存储介质。
背景技术
大数据背景下,数据规模急剧扩大,数据形式多样,对数据应用的要求也日益提高。随着业务的拓展,数据量激增,导致单数据节点的存储能力问题逐渐显露,靠简单的扩容硬盘来提高存储能力会导致故障风险增加,产生数据丢失、服务器宕机等现象。
知识图谱作为一种新型的数据形式,通过将相关联的数据实体提取并统一起来,可以解决数据节点存储能力的问题。现有技术下,利用图数据库构建和存储知识图谱,存在以下缺陷:1、对于用户的交互界面方面,图数据库本身只提供了基于Cypher语言的交互界面,针对不同数据需要不同的Cypher语句,数据过大时需要大量的Cypher语句,会占用大量计算机资源,同时操作不友好。2、需要专业的研发人员编写Cypher语言来创建、查询图谱,所以对于非研发人员来说在图数据库中去定义一个知识图谱是非常困难的,基本上无法操作。
发明内容
本发明提供一种知识图谱构建方法、装置及计算机可读存储介质,其主要目的在于降低知识图谱构建门槛,提高便捷性。
为实现上述目的,本发明提供的一种知识图谱构建方法,包括:
从预设数据库中检索得到原始数据集,提取所述原始数据集中的实体信息和相关关系;
利用所述实体信息和相关关系创建节点属性和节点关系;
获取所述原始数据集对应的业务数据表,解析所述业务数据表的表头信息,得到表头信息集;
将所述表头信息集与所述节点属性及所述节点关系通过实体链接分别对应,得到节点属性值以及节点关系值,汇总所述节点属性值以及节点关系值,得到解析值集;
根据所述解析值集及预先构建的图查询语句模板,得到标准图查询语句,根据所述标准图查询语句,得到知识图谱,并将所述知识图谱通过电子设备的显示屏幕输出。
可选地,所述提取所述原始数据集中的实体信息和相关关系,包括:
利用自然语言处理技术从所述原始数据集中提取多个关键词,并将所述关键词作为目标实体,得到所述实体信息;
分析所述实体信息中包含的实体之间的关系,得到所述相关关系。
可选地,所述利用所述实体信息和相关关系创建节点属性和节点关系,包括:
根据所述实体信息中的实体为知识图谱的节点;
根据所述实体的属性,得到所述知识图谱的节点属性;
根据实体之间两两的相关关系,得到节点之间的所述节点关系。
可选地,所述解析所述业务数据表的表头信息,得到表头信息集,包括:
利用预设的解析组件中的类函数解析所述表头信息,得到表头信息实体、表头信息属性及表头信息关系;
汇总所述表头信息实体、表头信息属性及表头信息关系得到所述表头信息集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010947237.6/2.html,转载请声明来源钻瓜专利网。