[发明专利]基于深度嵌入表示和深度图计算的知识表示方法及系统在审

专利信息
申请号: 202210725208.4 申请日: 2022-06-24
公开(公告)号: CN114969381A 公开(公告)日: 2022-08-30
发明(设计)人: 赵晶;吴栋林;耿玉水;王新刚;孙涛 申请(专利权)人: 齐鲁工业大学
主分类号: G06F16/36 分类号: G06F16/36;G06F16/335;G06F16/35;G06F40/194;G06F40/30;G06K9/62
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 闫圣娟
地址: 250353 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 嵌入 表示 计算 知识 方法 系统
【说明书】:

本公开涉及知识图谱技术领域,提出了基于深度嵌入表示和深度图计算的知识表示方法及系统,包括如下过程:针对被处理的知识图谱,利用深度图计算链接预测算法,根据知识图谱的图结构和语义信息,预测知识图谱中可能形成链接的实体对;利用深度嵌入自适应知识嵌入方法,采用自适应度量方法和深度嵌入空间投影相结合,验证链接预测阶段得到的实体对之间的关系,形成正确的三元组,更新知识图谱。本公开充分考虑知识图谱内部信息,基于深度嵌入表示和深度图计算,应用两种改进方法的结合方式实现知识图谱的缺失补全。

技术领域

本公开涉及知识图谱相关技术领域,具体的说,是涉及基于深度嵌入表示和深度图计算的知识表示方法及系统。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术信息,并不必然构成在先技术。

知识图谱在很多人工智能应用上发挥着重要的作用,例如智能问答、信息推荐、网页搜索等。知识图谱是一个结构化的语义网络,存储着大量的事实三元组(包括头实体,关系,尾实体),通常简化为(h,r,t)。知识表示学习是面向知识库中实体和关系的表示学习。当构建大规模知识图谱,需要不断补充实体间的关系时,利用知识表示学习可以进行知识图谱补全。

目前,知识表示主流的方法如下:

(1)翻译模型:在现有的知识表示学习方法中,TransE模型是一个十分具有代表性的方法。通过词向量存在平移不变性,将知识库中的关系看作实体间的平移向量,也就是在知识表示空间中头实体向量经过关系向量的转换后与尾实体向量的欧氏距离。TransE模型参数较少,计算的复杂度低,能直接建立起实体与关系之间的复杂语义关系。后续基于TransE模型又提出了TransR等多个可以处理一对多、多对一、多对多关系的翻译模型。TransR模型通过对实体多种属性,以及不同关系关注实体不同方面的考量,在实体空间和关系空间中建模实体和关系,并在对应的关系空间中利用关系投影矩阵进行转换。TransA采用椭圆等势面代替球形等势面,可以更好地表示由复杂关系引起的复杂嵌入拓扑。此外,TransA可以被视为加权转换后的特征维数,抑制了来自无关维度的噪声。

(2)神经网络模型(DKRL模型):DKRL模型通过使用深度神经网络模型增强实体描述来增强嵌入,从而扩展了TransE模型。然而,DKRL模型需要额外的空间来存储内层参数,并依赖于更多的超参数进行调优。RLKB模型建立了一个单层神经模型,该模型只需要较少的参数就可以实现知识库的表示学习。之前该任务的模型多是浅层的,相比于深的多层模型,学习特征的能力较弱,因此后来研究者提出多层卷积网络ConvE模型。ConvE模型首先把头实体和关系转换为二维向量,接下来利用卷积层和全连接层获取交互信息,然后与矩阵W和尾实体进行计算,判断当前三元组的可信度。但ConvE模型忽略了三元组的全局特征,所以后续研究者提出了ConvKB模型,该模型可以捕获实体之间的全局关系和过渡特性,以及知识库中的关系。CapsE模型采用胶囊神经网络模型,首先把头实体、关系、尾实体表示称k×3的矩阵,接下来通过卷积层获取其特征信息,然后对特征信息进行压缩并进行动态路由,最后计算三元组的可信度。

(3)其他模型:除了应用较多的翻译模型与神经网络模型以外,距离模型、单层神经网络模型、张量神经网络模型和双线性模型模型也有着广泛使用。距离模型中的结构表示是早期的知识表示方法。在结构表示中,实体使用d维度的向量表示,所有的实体都被投影到同一个d维向量空间中。单层神经网络模型使用单层神经网络的非线性操作,减弱结构表示无法协同准确刻画实体与关系的语义联系的问题。语义匹配能量模型提出复杂操作,寻找实体和关系之间的语义联系。张量神经网络模型使用双线性张量代替传统神经网络中的线性变换层,在不同的维度下将头实体和尾实体向量联系起来。双线性模型中的隐变量模型提出利用基于关系的双线性变换,刻画实体和关系之间的二阶联系。

发明人发现,上述的知识表示学习方法,TransE以及部分改进模型多使用欧氏距离作为得分函数中的度量,每个特征维度以相同的权重参与计算,准确性会受到无关维度的影响,灵活性不高。同时在用于现实的大规模知识图谱时时间开销巨大。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210725208.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top