[发明专利]一种基于深度交互推理模型的事实检测方法在审
申请号: | 202110955878.0 | 申请日: | 2021-08-19 |
公开(公告)号: | CN113837384A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 周德宇;司加胜;李同哲 | 申请(专利权)人: | 东南大学 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N3/04;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 薛雨妍 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 交互 推理 模型 事实 检测 方法 | ||
1.一种基于深度交互推理模型的事实检测方法,其特征在于:包括如下步骤:
(1)使用BERT模型对陈述和证据分别进行编码;
(2)通过多头映射机制抽取证据的语义信息,并将其保存到记忆池中;
(3)计算陈述与每条证据之间的语义关系;基于注意力机制获取证据集合的整体表示,并计算陈述和证据整体表示之间的推理关系;
(4)将推理结构升级为多层结构,对推理关系进行迭代式地更新;
(5)通过单层前馈神经网络和softmax操作对陈述的真实性进行判断。
2.根据权利要求1所述的一种基于深度交互推理模型的事实检测方法,其特征在于:
所述步骤(1)中使用BERT模型对陈述和证据分别进行编码,具体包括:
对于陈述c=[c1,c2,…,clc],其中ci表示陈述中第i个单词,lc表示陈述的长度,其所对应的证据集合为E={e1,e2,...,eM},ei=[ei,1,ei,2,…,ei,le](1≤i≤M),其中ei,j表示第i条证据中第j个单词,le表示第i条证据的长度,M表示对应证据的数目;
对于陈述和每条证据,分别输入到BERT模型中,得到陈述编码向量和证据编码向量{Emb1,Emb2,...,EmbM},如公式(1)、(2)所示,其中Emblen表示编码维度;
Embc=BERT(c1,c2,…clc) (1)
Embi=BERT(ei,1,ei,2,…ei,le) (2)
3.根据权利要求1所述的一种基于深度交互推理模型的事实检测方法,其特征在于,所述步骤(2)中通过多头映射机制抽取证据的语义信息,并将其保存到记忆池中,具体包括:
构造N个不同的映射矩阵来抽取证据中不同角度的信息,其中,Sublen=Emblen/N表示子空间的维度;通过映射矩阵将证据编码向量Embi(1≤i≤M)映射到不同的子空间中,获取基于特定角度的特征表示,
如公式(3)所示
将不同子空间提取到的特征表示拼接起来,作为更新后的证据表示,如公式(4)所示,其中concat()函数表示拼接操作,
将更新后的证据表示保存到记忆池中,如公式所示(5)所示,其中
H={NewEmb1,NewEmb2,...,NewEmbM} (5)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110955878.0/1.html,转载请声明来源钻瓜专利网。