[发明专利]知识图谱中三元组真实性检测方法和装置有效
申请号: | 202010417038.4 | 申请日: | 2020-05-18 |
公开(公告)号: | CN111339321B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 谭真;赵翔;王俞涵;郭得科;李欣奕;徐浩;肖卫东 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62;G06N3/04 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 董惠文 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 三元 真实性 检测 方法 装置 | ||
本申请涉及一种知识图谱中三元组真实性检测方法和装置。所述方法包括:从文本中提取描述知识图谱中三元组结构信息的第一向量和描述知识图谱中三元组描述信息的第二向量,将第一向量和第二向量进行融合,得到融合向量,根据预先设置的胶囊网络的网络结构,构建用于定义三元组得分的评分函数,根据评分函数,构建用于训练胶囊网络的损失函数,根据融合向量构建样本集,根据样本集和损失函数对胶囊网络模型进行训练,得到训练好的胶囊网络,将待预测三元组对应的融合向量输入训练好的胶囊网络,根据评分函数的输出值,确定三元组的关系是否准确。采用本方法能够提高三元组真实性检测的准确率。
技术领域
本申请涉及知识图谱技术领域,特别是涉及一种知识图谱中三元组真实性检测方法和装置。
背景技术
自Google于2012年首次提出知识图谱的概念以来,它就以非常快的速度在人工智能领域发展。如今,与知识图谱相关的研究和工作在人工智能的各个领域中都发挥了举足轻重的作用。就其本身而言,知识图谱通常以三元组(head, relation, tail)的方式存储。三元组可显示图谱内部结构和关系的特征。近年来,关于表示学习,关系预测和图谱补全的研究是基础部分。它们也是知识图谱中最重要的部分。有许多相关方法,例如TransE(Bordes et al., 2013), DistMult (Yang et al., 2014), ComplEx (Trouillon etal., 2016), ProjE (Shi and Weninger, 2017b) and RDF2Vec (Ristoski andPaulheim, 2016).这些方法的共同特点是对三元组真实性的判断。有些人还使用胶囊网络(Dai Quoc Nguyen et al., 2019)来判断知识图谱三元组的真实性。
知识图在现实中应用时,通常会有新的实体出现。这些实体不在知识图中,但是我们还需要判断它们是否与图中的实体有关系。在应用中使用知识图谱时,如果仅使用或检索图谱中的实体和关系,即知识图在使用过程中不再更改和更新,则我们将这种知识图称为静态知识图谱。在应用中,我们将使用和检索不在知识图谱中的实体,也就是说,知识图谱在使用过程中发生更改和更新。我们称这种知识图谱为开放世界知识图谱。例如,在回答“Is Beijing the capital of china”的问题时,我们需要判断三元组(Beijing,capital_of, China)是否正确。如果三元组中的Beijing不是知识图谱中的实体,那么在这种情况下,我们将此知识图谱称为开放世界知识图。
然而传统的三元组真实性检测方法,是基于三元组中实体和关系的向量进行预测,无法体现实体与关系之间的关联,从而导致三元组真实性检测不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够解决三元组真实性检测不准确问题的知识图谱中三元组真实性检测方法和装置。
一种知识图谱中三元组真实性检测方法,所述方法包括:
从文本中提取描述知识图谱中三元组结构信息的第一向量和描述知识图谱中三元组描述信息的第二向量;
将所述第一向量和所述第二向量进行融合,得到融合向量;
根据预先设置的胶囊网络的网络结构,构建用于定义三元组得分的评分函数;
根据所述评分函数,构建用于训练所述胶囊网络的损失函数;
根据所述融合向量构建样本集,根据所述样本集和所述损失函数对所述胶囊网络模型进行训练,得到训练好的胶囊网络;
将待预测三元组对应的融合向量输入训练好的胶囊网络,根据所述评分函数的输出值,确定三元组的关系是否准确。
在其中一个实施例中,还包括:从文本中提取知识图谱中的三元组;将所述三元组输入预先训练的TransE模型,得到描述知识图谱中三元组结构信息的第一向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010417038.4/2.html,转载请声明来源钻瓜专利网。