[发明专利]一种具有归纳能力的知识图谱推理方法在审
申请号: | 202210549260.9 | 申请日: | 2022-05-20 |
公开(公告)号: | CN115408531A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 张鹏 | 申请(专利权)人: | 矩阵纵横(北京)科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06N3/04 |
代理公司: | 北京世誉鑫诚专利代理有限公司 11368 | 代理人: | 刘秀珍 |
地址: | 100000 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 具有 归纳 能力 知识 图谱 推理 方法 | ||
本发明提供的一种具有归纳能力的知识图谱推理方法,对给定的知识图谱,需要先抽取出每一个三元组的闭合子图并利用关系表征来初始化实体表征,之后打乱实体表征得到负样本图谱。之后将正负样本图谱中的子图输入到子图神经网络,分别通过图神经网络学习子图实体表征以及通过循环神经网络学习关系路径表征,并结合二者形成最终的子图表征。之后通过打分函数对正样本图谱中的三元组进行打分进行有监督学习,同时通过互信息最大化的方法实现无监督学习,并结合二者更新模型参数。能够充分利用子图结构信息及关系表征对新图谱实现归纳式的推理,从而更好地对新知识图谱进行补全。
技术领域
本发明涉及知识图谱领域,尤其涉及一种具有归纳能力的知识图 谱推理方法。
背景技术
知识图谱是知识工程中重要的一个方法,为现实生活中实体的一 种网络,并包含实体间的关系。一个知识图谱由结构化的事实三元组 信息构成。知识图谱有广阔的应用场景,比如基于知识图谱的问答系 统,推荐系统。但是由于现实生活中的信息不能够被完全表示进知识 图谱中,所以现如今的知识图谱都有信息不完整的问题。为了补全知 识图谱,知识图谱推理致力于推理出实体间可能缺失的关系,从而在 一定程度上缓解问题。然而现实生活中许多新出现的实体被不断地加 入到知识图谱中,比如电商数据库中添加的新用户。
为了能够推理新实体间的关系,知识图谱推理模型需要具有归纳 能力,能够将推理能力泛化到新实体上。在新知识图谱推理的情况下, 如何把原知识图谱的信息泛化到新知识图谱上是个重要的问题,这其 中涉及到如何进行知识的迁移、新实体的表征、关系表征的有效利用 以及如何表示三元组进行推理。
如何设计出满足上述要求的具有归纳能力的知识图谱推理方法 是一件很有价值同时兼具挑战的事情。目前知识图谱推理的方法通常 需要为每一个实体学习一个对应的表征,因此当新实体出现时便缺乏 对应的表征,这导致无法在新图谱上进行推理。目前与本发明存在一 定关联的方法为利用图神经网络学习目标三元组的闭合子图的表征 进行推理,过程不需要学习特定的实体表征,因此能够在新图谱上进 行推理。但是上述方法缺乏对关系表征的利用并且局限于局部信息, 导致推理能力仍有待提高。本发明与上述方法有较大区别,能够学习 到更充分的关系表征及全局信息,从而更好地在新图谱上进行推理。
发明内容
鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部 分地解决上述问题的一种具有归纳能力的知识图谱推理方法。
根据本发明的一个方面,提供了一种具有归纳能力的知识图谱推 理方法包括:
给定知识图谱,利用广度优先搜索算法抽取出每一个目标三元 组(u,rt,v)的闭合子图;
获取所述闭合子图的实体,采用聚合关系表征的方式初始化实 体表征;
将含有实体表征和关系表征的所述闭合子图输入到图神经网 络中;
获取所述闭合子图的关系路径表征;
将所述闭合子图的实体表征及所述关系路径表征进行连结,获得 所述闭合子图的表征信息;
根据每个所述目标三元组,利用所述表征信息对存在可能性进行 打分;
根据每个所述目标三元组,创建负样本三元组,并根据每个所 述目标三元组的标签进行有监督损失函数:
其中(u',r't,v')为负样本三元组,γ为超参数;
基于互信息最大化原理进行无监督学习;
将所述有监督学习与所述无监督学习结合起来进行联合学习 训练。
可选的,所述闭合子图内的最长路径为3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于矩阵纵横(北京)科技有限公司,未经矩阵纵横(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210549260.9/2.html,转载请声明来源钻瓜专利网。