[发明专利]一种基于层级注意力和标签引导学习的关键信息识别方法在审

专利信息
申请号: 202111319941.8 申请日: 2021-11-09
公开(公告)号: CN114139522A 公开(公告)日: 2022-03-04
发明(设计)人: 牛振东;何慧;张春霞;白思萌;易坤 申请(专利权)人: 北京理工大学
主分类号: G06F40/194 分类号: G06F40/194;G06F40/289;G06K9/62;G06N3/04;G06V30/41;G06V30/413;G06F16/35
代理公司: 北京正阳理工知识产权代理事务所(普通合伙) 11639 代理人: 张利萍
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 层级 注意力 标签 引导 学习 关键 信息 识别 方法
【权利要求书】:

1.一种基于层级注意力和标签引导学习的关键信息识别方法,其特征在于,包括以下步骤:

步骤1:采集文献数据;

步骤2:解构文献数据并存储;

步骤3:文本预处理,包括对预训练语料库进行预处理,构建预训练集;

步骤4:构建预训练词编码层;

首先,获取在无标签文本语料库上预训练的语言表示模型;

然后,将步骤3构建的预训练集输入到预训练后的语言表示模型中,将所有词语映射为词向量,获得嵌入矩阵We,同时,将模型权重调至损失稳定;

步骤5:采用层级注意力和标签引导学习融合模型,进行关键信息识别,其中,融合模型包括:词编码层、词注意力层、句编码层、句注意力层、标签引导学习层和分类层;

包括以下步骤:

步骤5.1:将步骤3构建的训练集输入到词编码层;

设输入为一个句子包含单词wit,t∈[0,T],其中,t表示时刻,T表示总的时间;

首先,通过步骤4微调后的预训练语言模型,将单词表示为向量xij=Wewij,其中,wij表示单词;然后,使用双向长短期记忆网络,通过汇总来自单词两个方向的信息,获得单词注释,将上下文信息整合到注释中;其中,双向长短期记忆网络包含前向意为从wi1到wiT读取句子si,以及后向意为从wiT到wi1读取句子si

计算时间t时,双向长短期记忆网络的双向隐藏状态和以及隐藏状态ht=(1-zt)⊙ht-1+zt⊙ht是前一状态ht-1和当前状态ht之间用新的序列信息计算的线性插值;表示前向隐藏状态,表示后向隐藏状态;xit表示t时刻输入单词的向量,⊙表示点乘操作;

其中,更新门zt决定保留多少过去的信息和添加多少新信息,门zt的更新方式为:zt=σ(Wzxt+Uzht-1+bz),其中,xt是t时刻的序列向量,σ表示激活函数,Wz、Uz均为门神经元权重矩阵,bz表示偏置;

候选状态ht的计算方式为:h=tanh(Whxt+rt⊙(Uhht-1)+bh),其中,rt为重置门,控制过去状态对候选状态的贡献程度,如果rt为0则会忘记前一个状态;tanh为激活函数;Wh、Uh均表示门神经元权重矩阵,bh表示偏置;

步骤5.2:拼接步骤5.1获得的前向隐藏状态和后向隐藏状态获得给定单词wit的注释,即:以wit为中心,总结整个句子信息;

步骤5.3:将隐藏状态输入到词注意力层;

设文档有L个句子si,每个句子包含Ti个单词,wit,t∈[1,T]表示第i个句子中的单词;

在词注意力层,引入注意力机制来提取对句子意义重大的词语,并聚合这些词语的表示,形成句子向量;

将步骤5.2获得的hit通过单层感知器获得hit的隐藏表示uit,然后将单词的重要性作为其与单词级上下文向量uw的相似性进行度量,并通过激活函数获得归一化的重要性权重αit;通过基于权重的单词注释的加权和,计算句子向量si

步骤5.4:将句子向量si输入句编码层,得到隐藏状态和

步骤5.5:拼接和得到句子注释,即

步骤5.6:将隐藏状态hi输入到句注意力层,获得句子级上下文向量ui,并使用该向量来衡量句子的重要性,获得样本向量v,其总结了样本中句子的所有信息;

步骤5.7:将句子v输入到标签引导学习层;

将标签进行表示,其中l为标签,Cl为l的表示向量;然后将句子信息v=[v1,v2,...,vd]投影到标签表示空间,vd表示在d维上的子向量;

计算方式为:其中,ul表示最终的文本序列;d表示v的维度;vj表示第j个子向量;wlj是标签注意力权重,用来衡量标签文本对<vj,Cl>兼容性,兼容性通过余弦相似度计算;

步骤5.8:将ul输入到分类层进行文本分类,获得概率p=softmax(Wcul+bc),Wc表示权重矩阵,bc表示偏置;使用标签的负对数似然作为损失函数,其中,pdj表示获得的概率,j是样本d的标签。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111319941.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top