[发明专利]三元组的校验方法、装置、设备和介质有效

专利信息
申请号: 202110594046.0 申请日: 2021-05-28
公开(公告)号: CN113298160B 公开(公告)日: 2023-03-07
发明(设计)人: 曾钢欣 申请(专利权)人: 深圳数联天下智能科技有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06N3/0499;G06N3/048;G06N3/045;G06N3/08
代理公司: 深圳中细软知识产权代理有限公司 44528 代理人: 孔祥丹
地址: 518000 广东省深圳市南山区粤海街道高*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 三元 校验 方法 装置 设备 介质
【说明书】:

发明公开了一种三元组的校验方法,该方法包括:首先对待校验三元组进行随机抽样标注,得到已标注的第一三元组和未标注的第二三元组。然后获取第一三元组的输入向量和标注信息以训练第一二分类模型,再用该第一二分类模型对第二三元组进行校验。再采用自训练的方法,根据第一三元组、第二三元组和校验结果确定标注数据集,以该标注数据集训练第二二分类模型,最后用目标分类模型完成对待校验三元组的校验。本方案在仅标注少量三元组的前提下仍能得到训练所需样本数量的标注数据集,增加训练后目标分类模型的拟合能力,可见本方案仅需要少量的标注数据即可获得较好的效果。此外,还提出了三元组校验装置、设备和存储介质。

技术领域

本发明涉及知识图谱技术领域,尤其是涉及三元组的校验方法、装置、设备和介质。

背景技术

随着人工智能的发展,知识图谱在人工智能的应用底层越来越重要。对于传统的知识图谱构建而言,整个过程需要花费大量的人力和物力,因此无监督的知识图谱构建方案成为现阶段的发展主流。然而无监督的知识图谱构建方案由于缺乏人工的介入,抽取出来的三元组并不是非常准确,也常需要进行人工校正,而三元组的误差将会影响知识图谱的构建,因此如何在较少人工介入的前提下保证三元组的准确性就显得十分重要。

发明内容

基于此,有必要针对上述问题,提供实现在较少人工介入的前提下保证三元组的准确性的三元组的校验方法、装置、设备和介质。

一种三元组的校验方法,所述校验方法包括:

获取待校验三元组,随机抽样标注所述待校验三元组,得到已标注的第一三元组和未标注的第二三元组;

通过预训练模型将所述第一三元组的三元组信息嵌入为输入向量,所述第一三元组信息包括头实体、关系、尾实体和所述第一三元组所在的句子,获取所述第一三元组的标注信息,所述标注信息包括每一所述第一三元组是否可信,根据所述输入向量及所述标注信息训练第一二分类模型;

用训练后的所述第一二分类模型对所述第二三元组进行第一校验,获取所述第二三元组对应的第一校验结果,所述第一校验结果为所述第二三元组是否可信;

根据所述第一三元组、所述第二三元组和所述第一校验结果确定标注数据集,根据所述标注数据集训练第二二分类模型,用训练后的所述第二二分类模型对所述待校验三元组进行第二校验,得到所述待校验三元组的第二校验结果,所述第二校验结果为所述待校验三元组是否可信。

在其中一个实施例中,所述通过预训练模型将所述第一三元组的三元组信息嵌入为输入向量,包括:

对每个所述第一三元组,通过所述预训练模型对所述头实体、所述关系和所述尾实体分别进行编码,得到所述头实体对应的第一向量,所述关系对应的第二向量和所述尾实体对应的第三向量;

依照所述第一向量、所述第二向量和所述第三向量的顺序依次进行连接,得到第一输入向量;

通过所述预训练模型对所述句子进行编码,将编码后的句子作为第二输入向量,所述输入向量包含所述第一输入向量和所述第二输入向量。

在其中一个实施例中,所述第一二分类模型包括前馈神经网络和激活函数,所述根据所述输入向量及所述标注信息训练第一二分类模型,包括:

所述第一二分类模型根据所述输入向量将所述待校验三元组的可信程度映射到0到1之间,根据所述标注信息和映射的结果计算映射误差;

根据所述映射误差调整所述第一二分类模型的模型参数,直至所述映射的结果满足预设校验标准。

在其中一个实施例中,所述根据所述第一三元组、所述第二三元组和所述第一校验结果确定标注数据集,包括:

将所述第一三元组和第一校验结果为可信的第二三元组作为所述标注数据集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳数联天下智能科技有限公司,未经深圳数联天下智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110594046.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top