[发明专利]一种事实验证方法、系统、计算机设备和存储介质有效
申请号: | 202110081136.X | 申请日: | 2021-01-21 |
公开(公告)号: | CN112396185B | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 陈洪辉;陈翀昊;蔡飞;陈皖玉;郑建明;邵太华;郭昱普 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N3/04;G06F16/33 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 曾志鹏 |
地址: | 410003 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事实 验证 方法 系统 计算机 设备 存储 介质 | ||
本申请涉及一种事实验证方法、系统、计算机设备和存储介质,该方法包括:输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果。该方法通有助于捕捉证据之间的关系,并提升了推理模型的可解释性,此外,该方法还显示出分层异构图神经网络方法的有效性,显著提高了事实验证的准确度和效率。
技术领域
本申请涉及信息技术领域,特别是涉及一种事实验证方法、系统、计算机设备和存储介质。
背景技术
对于事实验证,现有的方法主要把事实验证任务与传统的自然语言推理任务进行类比,通过构建声明-证据对并提取特征来支撑下游的预测任务。传统的自然语言推理方法一般通过拼接声明和相关证据句,并提取相应句子级别的特征,从而作为预测层的输入。除此以外,还可以针对每一个证据句子够着声明-证据对,从而更精细的考虑到不同证据带来的影响。但是,这些方法都没有考虑到证据句子之间的语义关联性,因此难以解决一些需要多个证据共同判断的声明。为了解决该问题,通过引入全连接的图结构把不同的证据句子作为图中的节点,基于图进行证据句子的整合推理。除以以外,人们也提出在由切分的证据句子上进行图的构建,从而进一步探索证据间可能存在的语义关联。
但是先前的方法通常只是提取了句子级别的特征作为证据的特征表示,却忽略了结合实体以及上下文这些可以丰富证据表示的重要特征。此外,现有的方法主要是为了提高标签预测的准确性,而忽视了对事实验证模型可解释性的探索,这可能导致验证结果并不可靠。而且,现有的模型通常只关注提升单证据或多证据场景下的事实验证,不能同时适用于这两种情况。
发明内容
基于此,有必要针对上述技术问题,提供一种事实验证方法、系统、计算机设备和存储介质。
第一方面,本发明实施例提供了一种事实验证方法,包括以下步骤:
输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集;
基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图;
将所述声明和所述证据集进行拼接,对节点进行初始化,得到节点的特征表示;
根据所述分层异构图中节点的神经网络传播方向,对节点的特征表示进行基于推理的更新;
对更新后节点的特征表示进行推理路径的搭建,根据所述推理路径输出所述声明的预测结果。
进一步的,所述输入待验证的声明,并对所述声明进行检索,获取所述声明的证据集,包括:
根据输入的所述声明,利用句子解析器提取所述声明的关键词组;
通过检索工具的应用接口检索所述关键词组的关联文档,将所述关联文档存储在文章集中;
搭建句子检索模型对所述文章集中的文章进行句子检索,输出和所述声明相关的关联句子;
利用所述检索模型对所述关联句子进行相关度打分,将分数落在预设阈值之内的句子作为证据集。
进一步的,所述基于所述证据集,构造由实体节点、句子节点和上下文节点组成的分层异构图,包括:
从所述证据集中分别提取出所有句子组成的上下文节点、证据句组成的句子节点和名词短语组成的实体节点;
构建从所述实体节点到所述句子节点的第一有向边、从所述句子节点到所述上下文节点的第二有向边;
根据所述实体节点构建句子级链接、上下文级链接和文章级链接的第三有向边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110081136.X/2.html,转载请声明来源钻瓜专利网。