[发明专利]基于均值融合的异构信息网知识图谱补全方法和装置有效
申请号: | 202110712068.2 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113268612B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 谭真;赵翔;王俞涵;肖卫东;李硕豪;黄旭倩;庞宁;李妍 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F16/35;G06F40/194;G06N3/04;G06N3/08 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 邱轶 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 均值 融合 信息网 知识 图谱 方法 装置 | ||
本申请涉及一种基于均值融合的异构信息网知识图谱补全方法和装置。所述方法包括:根据开放世界知识图谱,构建异构信息网知识图谱,根据异构信息网知识图谱中相邻节点的相似度信息,确定相邻节点间边的权重,根据所述异构信息网络知识图谱中每条边的权重,得到异构信息网络知识图谱对应的权重矩阵,在R‑CGN算法的基础上对关系节点进行均值融合,从第三特征矩阵中提取三元组,并构建三元组的评分函数,根据预先训练的预测模型和评分函数,进行异构信息网知识图谱补全。采用本方法能够提高知识图谱补全的准确性。
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于均值融合的异构信息网知识图谱补全方法和装置。
背景技术
自2012年Google首次引入知识图谱(knowledge graph,KG)概念以来,它在人工智能领域以极快的速度发展。目前,知识图谱相关的研究和工作在人工智能方向中的各个领域都发挥着举足轻重的作用。就其本身而言,知识图谱通常以三元组(头实体,关系,尾实体)的方式进行储存与表示,它们显示了图谱的结构和关系。近年来,由于知识图谱的不完全性和稀疏性,关于表示学习、关系预测、图谱补全等知识图谱的研究引起了众多学者的关注。提出的模型,如TransE、DistMult和ComplEx具有优异的表现。此外,一些基本模型利用胶囊网络来判断三元组的真实性,可以过滤错误三元组,提高知识图谱的精度。
但是,上述模型忽略了现实世界中知识图谱是动态变化的,往往需要添加新的实体来完善和更新知识图谱。这些实体对于现有的知识图谱来说是未知的,但是还需要判断它们是否与图谱中其他实体是否有关系。
因此,传统的封闭世界表示学习模型只能利用已有的实体来完善知识图谱,很难预测已知实体和未知实体之间的关系。例如,有一个问题“北京是中国的首都吗?“要回答这个问题,我们需要判断三元组(中国、首都、北京)是否属实。如果三元组中的中国不是知识图谱中的实体,那么在本例中,这个知识图谱被定义为一个开放世界知识图谱。现在,在这种情况下,将利用实体的描述性文本来帮助确定三元组的真实性。
近年来,一些学者尝试基于开放世界假设来表示知识图谱,它结合实体的描述性文本来捕捉未知实体的特征,如ConMask和OWE,ConMask需要基于上下文的隐式推理,因此对链接预测的评价依赖于上下文描述性文本的长度。缺少文字将导致准确率急剧下降。在OWE模型中,它直接使用描述性文本的嵌入来代替未知实体的嵌入。三元组的结构性嵌入和描述性嵌入不能很好地融合。2021年提出的Caps-OWKG算法同样采用的是融合三元组的结构性嵌入表示与描述性嵌入表示的方法,并辅以胶囊网络来进一步挖掘三元组的特征,虽然在面向开放世界知识图谱的补全任务中,有了较以往算法更好的表现,但该模型三元组的结构性嵌入和描述性嵌入依然不能完美地融合。而且这个模型对于新实体(未知实体)与原始三元组之间的联系利用比较单一,忽略了很多隐性的联系,从而导致开放世界知识图谱补全准确率不高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够解决开放世界知识图谱补全准确率不高问题的基于均值融合的异构信息网知识图谱补全方法和装置。
一种基于均值融合的异构信息网知识图谱补全方法,所述方法包括:
获取文本数据,根据所述文本数据,构建开放世界知识图谱;
根据开放世界知识图谱,构建异构信息网知识图谱;所述异构信息网知识图谱中节点的节点类型包括:实体节点、关系节点、实体描述信息节点以及实体类型信息节点;
根据所述异构信息网知识图谱中相邻节点的相似度信息,确定相邻节点间边的权重;
根据所述异构信息网络知识图谱中每条边的权重,得到所述异构信息网络知识图谱对应的权重矩阵;
获取所述异构信息网络知识图谱中节点对应的节点特征矩阵,根据所述权重矩阵,采用第一层GCN算法对所述节点特征矩阵进行更新,得到第一特征矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110712068.2/2.html,转载请声明来源钻瓜专利网。