[发明专利]知识图谱补全的方法、装置、电子设备及存储介质有效
申请号: | 201910715581.X | 申请日: | 2019-08-05 |
公开(公告)号: | CN110427524B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 姜文斌;李莹;吕雅娟;王泉;朱勇;张扬;袁鹏程 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/906 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 钭飒飒;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 方法 装置 电子设备 存储 介质 | ||
本申请公开了知识图谱补全的方法、装置、电子设备及存储介质,涉及大数据技术领域。具体实现方案为:获取三元组在不同视角的视图实例;将所述不同视角的视图实例输入目标判别分类模型,获取所述三元组在所有视角上的综合分类结果;其中,所述综合分类结果用于表征所述三元组的有效性。从而可以从多个不同的视角衡量一个三元组的有效性指标,以更全面地衡量三元组的有效性。
技术领域
本申请涉及数据处理领域中的大数据技术,尤其涉及一种知识图谱补全的方法、装置、电子设备及存储介质。
背景技术
知识图谱补全旨在弥补知识图谱缺失信息,是知识图谱构建的重要技术。知识图谱是由(h,r,t)三元组构成的图状结构,其中h(head的简写)和t(tail的简写)分别是头实体和尾实体,r(relation的简写)是连接头尾实体之间的关系。知识图谱补全的任务旨在为知识图谱寻找缺失的三元组,其核心问题是判断一个给定的候选三元组的有效性。
目前,可以基于卷积神经网络(CNN)的判别分类方法进行知识图谱补全,该方法将h、r和t分别表示为嵌入向量(embedding),然后通过CNN对h、r和t的嵌入向量进行逐层的特征提取和特征抽象,并最终通过分类层获得该三元组的有效性。
但是,上述方法中卷积神经网络一般只能进行二元判断,其建模的视角单一,对三元组的有效性判断不够全面。
发明内容
本申请提供一种知识图谱补全的方法、装置、电子设备及存储介质,可以从多个不同的视角衡量一个三元组的有效性指标,从而更全面地衡量三元组的有效性。
第一方面,本申请实施例提供一种知识图谱补全的方法,包括:
获取三元组在不同视角的视图实例;
将所述不同视角的视图实例输入目标判别分类模型,获取所述三元组在所有视角上的综合分类结果;其中,所述综合分类结果用于表征所述三元组的有效性。
本实施例中,通过将不同视角的视图实例输入到目标判别分类模型中,从而可以得到各个不同视角的视图实例的分类结果,最后求取所有视角上的综合分类结果,实现了从多个不同视角来评估三元组的有效性,以更好的进行知识图谱补全。
在一种可能的设计中,在将所述不同视角的视图实例输入目标判别分类模型之前,还包括:
构建初始判别分类模型;所述初始判别分类模型包括:编码层和分类层;所述编码层用于将输入的视图实例编码为实数向量,并将所述实数向量发送给所述分类层;所述分类层用于输出所述实数向量对应的分类结果;
以知识图谱中所有三元组对应的正例和负例的交叉熵损失最小为优化目标,通过正例和负例训练所述初始判别分类模型,得到所述目标判别分类模型。
在一种可能的设计中,所述正例是由视图正例生成函数根据三元组生成的;所述负例是由视图负例生成函数根据三元组生成的,或者所述负例是通过对正例的修改得到的;其中,所述负例对应的三元组不属于所述知识图谱。
本实施例中,首先构建初始判别分类模型,然后通过正例和负例训练初始判别分类模型,并以所有三元组对应的正例和负例的交叉熵损失最小为优化目标,不断优化初始判别分类模型的参数,得到目标判别分类模型。从而可以通过目标判别分类模型对不同视图示例进行判别,提高了分类效率和分类准确率。
在一种可能的设计中,获取三元组在不同视角的视图实例,包括:
基于三元组(h,r,t),通过视图实例生成函数生成第一视图实例、第二视图实例、第三视图实例、第四视图实例中至少两类视图实例;其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910715581.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可适配的基于大数据的营商环境应用系统
- 下一篇:数据存取方法及装置