[发明专利]一种知识图谱补全方法、装置、设备以及存储介质有效
申请号: | 202010728082.7 | 申请日: | 2020-07-23 |
公开(公告)号: | CN112035672B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 傅向华;谢文豪 | 申请(专利权)人: | 深圳技术大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30;G06N3/0464;G06N3/08 |
代理公司: | 深圳青年人专利商标代理有限公司 44350 | 代理人: | 吴桂华 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 方法 装置 设备 以及 存储 介质 | ||
本发明属于知识图谱处理技术领域,尤其涉及一种知识图谱补全方法、装置、设备以及存储介质,本发明通过预设的关联信息抽取模型从知识图谱的实体描述文本信息中抽取知识图谱中实体与关系之间的语义关联信息,将语义关联信息与知识图谱进行关联与重构,通过深度Bi‑GRU网络以及预设的关联强化模型对实体描述文本输入序列进行编码,得到编码后的实体关联序列信息,通过单向GRU网络对实体关联序列信息进行解码,对解码后的知识图谱中的每个候选实体进行综合评分,依次将实体描述文本数据集中的每个实体链接到知识图谱中综合评分最高的候选实体,以补全知识图谱,从而增强已有知识图谱的语义关联信息。
技术领域
本发明属于知识图谱处理技术领域,尤其涉及一种知识图谱补全方法、装置、设备以及存储介质。
背景技术
随着互联网使用者数量的不断增加,网络中的数据量也呈现出指数增长趋势,但由于网络数据具有规模庞大、异质多源和结构松散等特点,使得人们从网络数据中获取有用的数据信息变得异常困难,在这种背景下,知识图谱技术于2012年由Google正式提出,并受到了研究者们的广泛关注。
其中,知识图谱补全任务是知识图谱技术中的一个主要研究方向,通过对现有的知识图谱补全,使得人们从网络数据中获取有用的数据信息变得简单。现有的知识图谱补全任务主要的方法大多是先将知识图谱中实体与关系的语义信息转换成密集的低维向量,然后通过翻译模型、复杂关系建模以及多源信息融合等知识图谱补全模型,在低维向量空间中利用知识图谱的结构特征高效地计算知识图谱中实体与关系的复杂语义关联,进而对已有知识图谱进行补全,但现有知识图谱补全模型大多都是利用已知实体来补全知识图谱中缺失的事实关系对,若实体是未知,例如通过引入外界新的实体来扩展知识图谱的规模,导致现有的知识图谱补全模型的准确率低,使得现有知识图谱补全模型可扩展性较差。另外,现有的知识图谱补全模型没有考虑到知识图谱中实体与关系之间的语义关联性,并且当知识图谱中实体或关系具有多源信息时仅通过单一的递归神经网络或者卷积神经网络进行特征提取操作,没有根据知识图谱的独特性质对其进行特征抽取,从而导致通过现有的知识图谱补全模型提取到的语义特征信息不准确,并且会对已有的知识图谱过多地引入语义噪声。
发明内容
本发明的目的是提供一种知识图谱补全方法、装置、设备以及存储介质,旨在解决由于现有知识图谱补全模型从外界引入新的实体来扩展已有的知识图谱规模,导致现有的知识图谱补全模型准确率低,可扩展性较差的问题。
一方面,本发明提供了一种知识图谱补全方法,所述方法包括下述步骤:
接收输入的知识图谱补全请求,根据所述知识图谱补全请求使用预设的关联信息抽取模型从所述知识图谱的实体描述文本信息中抽取所述知识图谱中实体与关系之间的语义关联信息;
将所述语义关联信息与所述知识图谱进行关联,对关联后的所述知识图谱进行重构,以得到重构后的知识图谱;
将重构后的所述知识图谱和预设的实体描述文本数据集组合成实体数据连接矩阵,并对所述实体数据连接矩阵进行序列化表示,得到实体描述文本输入序列;
通过深度Bi-GRU网络以及预设的关联强化模型对所述实体描述文本输入序列进行编码,得到编码后的实体关联序列信息;
通过单向GRU网络对所述实体关联序列信息进行解码,对解码后的所述知识图谱中的每个候选实体进行综合评分;
依次将所述实体描述文本数据集中的每个实体链接到所述知识图谱中综合评分最高的所述候选实体,以补全所述知识图谱。
优选地,接收输入的知识图谱补全请求,根据所述知识图谱补全请求使用预设的关联信息抽取模型从所述知识图谱的实体描述文本信息中抽取所述知识图谱中实体与关系之间的语义关联信息的步骤,包括:
将所述知识图谱中的实体以及实体描述文本信息映射为所述实体以及所述实体对应关系的三元组;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳技术大学,未经深圳技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010728082.7/2.html,转载请声明来源钻瓜专利网。