[发明专利]神经网络中基于实体与关系编码的知识图谱表示学习方法在审
申请号: | 202110752419.2 | 申请日: | 2021-07-02 |
公开(公告)号: | CN113553441A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 陆佳炜;朱昊天;王小定;马超治;王志鹏;梅浩;程振波;张元鸣;肖刚 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62;G06N3/04;G06N5/02 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 基于 实体 关系 编码 知识 图谱 表示 学习方法 | ||
一种神经网络中基于实体与关系编码的知识图谱表示学习方法,包括以下步骤:第一步、从知识库中构建目标三元组,并获得该三元组中头实体和尾实体之间所有的路径关系;第二步、进行关系编码;第三步、进行实体类型编码;第四步、获得第三步中头实体和尾实体的类型上下文向量,并将它们按顺序输入LSTM;第五步、组成路径模式vρ(p)和vρ(r),计算这两个路径模式的余弦相似度;第六步、训练表示学习方法。本发明实现对实体和关系的语义信息的表示,进而高效地计算实体、关系及其之间的复杂语义关联。
技术领域
本方法涉及一种神经网络中基于实体与关系编码的知识图谱表示学习方法。
背景技术
知识图谱由Google公司于2012年6月正式提出,是一种基于图的数据结构,也是一种结构化的语义知识库,以图的形式来展现现实世界中各个实体及其相互之间的关系,并用形式化的方式来进行描述,更是推荐系统,智能问答,信息检索等诸多人工智能应用的关键资源。知识图谱是用于存储现实世界中的人、事、物结构化客观事实信息的载体,通常以三元组为基本结构进行表示,每个三元组(h,r,t)包含头实体h,尾实体t以及实体之间的相互关系r。
近年来,人们构建了诸如DBpedia,Freebase等包含了数十亿三元组的大规模知识图谱,并将它们成功应用于诸多领域。但这些知识图谱中仍存在着一个公共问题,即与客观世界相比,这些知识图谱往往是不够完整的。大量事实三元组的缺失,使得以知识图谱为基础的人工智能应用不能发挥其潜在的性能。
知识图谱嵌入,即知识表示学习是面向知识库中实体和关系的表示学习,通过将大量交互的三元组(实体与关系)映射到低维向量空间,能够实现对实体和关系的语义信息的表示,还可以高效地计算实体、关系及两者之间的复杂语义关联。表示学习还能够通过预测缺失的链接对知识图谱进行补全,链接预测是通过实体之间已有的链接来自动预测实体之间缺失的链接。链接预测不仅需要预测两个实体之间是否存在着关系,还需要预测关系的具体类型,这也使得这项工作变得极具挑战性。
发明内容
为了克服现有技术的不足,本发明提出了一种神经网络中基于实体与关系编码的知识图谱表示学习方法,结合长短期记忆网络(Long Short-Term Memory,LSTM)对关系、关系类型和实体类型上下文向量进行编码结合,对输出结果进行张量压缩后,通过计算向量之间的余弦相似度来判定这个三元组是否成立,从而预测知识图谱中实体间的链接关系,实现对实体和关系的语义信息的表示,进而高效地计算实体、关系及其之间的复杂语义关联。
为了解决上述技术问题本发明提供如下的技术方案:
一种神经网络中基于实体与关系编码的知识图谱表示学习方法,包括以下步骤:
第一步、从知识库中构建目标三元组,并获得该三元组中头实体和尾实体之间所有的路径关系,过程如下:
1.1、在知识库中获取实体集E和关系集R,从中构建一个三元组S={(h,r,t)|h,t∈E∧r∈R},r是实体h和t之间的直接关系,h是头实体,t是尾实体;
1.2、获取h和t之间所有的关系路径集合P={p1,p2,…pN},其中,pi表示路径集合P中第i条路径,N表示关系路径的数量,h和t之间第i条路径表示为Pi=<h,ri1,ri2,…,riM,t>,M表示这条关系路径上关系的数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110752419.2/2.html,转载请声明来源钻瓜专利网。