[发明专利]基于图对比学习的验证方法、系统、设备和存储介质在审
申请号: | 202110680673.6 | 申请日: | 2021-06-18 |
公开(公告)号: | CN113312920A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 陈洪辉;蔡飞;陈翀昊;郑建明;潘志强;毛彦颖;张鑫;宋城宇;江苗;王祎童;王梦如 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F40/126 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 曾志鹏 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对比 学习 验证 方法 系统 设备 存储 介质 | ||
本申请涉及一种基于图对比学习的验证方法、系统、设备和存储介质,该方法包括:首先构造一个实体图来捕捉证据之间的关系;然后采用无监督图对比任务训练图卷积编码器,以保持图特征传播后的独有实体信息;然后利用聚合的实体特征增强声明证据对的表示,并在嵌入空间中应用有监督的对比任务将同类样本推近,将不同类的样本推离;最后基于声明证据对的特征表示对比来预测声明的标签分布。本发明实施例能够利用多个对比任务来缓解图神经网络在特征传播过程中节点特征的丢失,并且能够学习到不同标签的声明证据对中具有区别性的特征表示;并通过使用无监督的图对比子任务来解决以往基于图的方法中节点特征丢失的问题,提高声明验证的准确率。
技术领域
本申请涉及信息技术领域,特别是涉及一种基于图对比学习的验证方法、系统、设备和存储介质。
背景技术
事实验证的目标是根据从维基百科文章中检索到的证据来验证一个给定声明的真实性。这项任务的关键挑战是如何学习到一个较好的声明-证据对的特征表示,这对于生成预测标签至关重要。现有的研究主要利用声明与证据之间的语义相似性来区分不同的语义关系,如支持、反驳或信息不足。然而,由于部分否定词的存在,一些语义相似的声明和证据常常却拥有相反的真实性标签。因此,我们认为一个好的事实验证模型应该学习到具有区分性的特征表示,特别是针对于部分具有不同的标签但是语义上相似的声明-证据对。另外,以往的基于图神经网络的方法虽然能够很好地处理需要多个证据进行验证的声明,但其模型性能往往受到节点特征过平滑的限制,其容易导致节点信息的丢失。
基于图的模型还是无法避免节点特征过度平滑的问题,即原实体节点在经过几轮信息传播后,失去其独特的节点信息;此外,以往的监督训练由于训练次数有限,容易出现过拟合问题。这些方法通常是由标签来监督的,较少在样本中探索潜在的监督信号;最终致了对于声明验证的准确率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种基于图对比学习的验证方法、系统、计算机设备和存储介质。
第一方面,本发明实施例提供了一种基于图对比学习的验证方法,包括以下步骤:
对待验证的声明进行检索,获取所述声明的证据集;
使用命名实体识别工具提取所述证据集中包含的实体节点,通过所述实体节点之间的语义关系,构造由所述实体节点组成的实体图;
基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示;
利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征;
将所述实体节点特征输入到监督对比任务中,使得所述图卷积编码器在向量嵌入空间中拉近同类的声明证据对,推开不同类的声明证据对;
根据所述声明证据对的对比,对所述声明的标签进行验证。
进一步的,所述基于所述实体图,利用BERT模型来生成所述声明和所述证据集中的词语的实体特征表示,包括:
将所述证据集中的句子连接为序列证据文本,然后将所述序列证据文本与所述声明连接,形成输入序列;
基于所述输入序列,采用双向注意层来增强所述声明和所述证据集的特征交叉互动,生成所述声明和所述证据集的增强单词表示;
利用与实体相关联的证据中的文本跨度来生成初始实体节点表示,用于所述实体图的推理过程;
在所述输入序列内,将文本跨度内的单词平均池化和最大池化结果进行拼接,并输入到一个多层感知器生成所述实体特征表示。
进一步的,所述利用无监督的图对比任务来训练所述实体图对应的图卷积编码器,使得所述实体图在更新中保留区别性的实体节点特征,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110680673.6/2.html,转载请声明来源钻瓜专利网。