[发明专利]一种基于层级注意力和标签引导学习的关键信息识别方法在审
申请号: | 202111319941.8 | 申请日: | 2021-11-09 |
公开(公告)号: | CN114139522A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 牛振东;何慧;张春霞;白思萌;易坤 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/289;G06K9/62;G06N3/04;G06V30/41;G06V30/413;G06F16/35 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 张利萍 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 层级 注意力 标签 引导 学习 关键 信息 识别 方法 | ||
1.一种基于层级注意力和标签引导学习的关键信息识别方法,其特征在于,包括以下步骤:
步骤1:采集文献数据;
步骤2:解构文献数据并存储;
步骤3:文本预处理,包括对预训练语料库进行预处理,构建预训练集;
步骤4:构建预训练词编码层;
首先,获取在无标签文本语料库上预训练的语言表示模型;
然后,将步骤3构建的预训练集输入到预训练后的语言表示模型中,将所有词语映射为词向量,获得嵌入矩阵We,同时,将模型权重调至损失稳定;
步骤5:采用层级注意力和标签引导学习融合模型,进行关键信息识别,其中,融合模型包括:词编码层、词注意力层、句编码层、句注意力层、标签引导学习层和分类层;
包括以下步骤:
步骤5.1:将步骤3构建的训练集输入到词编码层;
设输入为一个句子包含单词wit,t∈[0,T],其中,t表示时刻,T表示总的时间;
首先,通过步骤4微调后的预训练语言模型,将单词表示为向量xij=Wewij,其中,wij表示单词;然后,使用双向长短期记忆网络,通过汇总来自单词两个方向的信息,获得单词注释,将上下文信息整合到注释中;其中,双向长短期记忆网络包含前向意为从wi1到wiT读取句子si,以及后向意为从wiT到wi1读取句子si;
计算时间t时,双向长短期记忆网络的双向隐藏状态和以及隐藏状态ht=(1-zt)⊙ht-1+zt⊙ht是前一状态ht-1和当前状态ht之间用新的序列信息计算的线性插值;表示前向隐藏状态,表示后向隐藏状态;xit表示t时刻输入单词的向量,⊙表示点乘操作;
其中,更新门zt决定保留多少过去的信息和添加多少新信息,门zt的更新方式为:zt=σ(Wzxt+Uzht-1+bz),其中,xt是t时刻的序列向量,σ表示激活函数,Wz、Uz均为门神经元权重矩阵,bz表示偏置;
候选状态ht的计算方式为:h=tanh(Whxt+rt⊙(Uhht-1)+bh),其中,rt为重置门,控制过去状态对候选状态的贡献程度,如果rt为0则会忘记前一个状态;tanh为激活函数;Wh、Uh均表示门神经元权重矩阵,bh表示偏置;
步骤5.2:拼接步骤5.1获得的前向隐藏状态和后向隐藏状态获得给定单词wit的注释,即:以wit为中心,总结整个句子信息;
步骤5.3:将隐藏状态输入到词注意力层;
设文档有L个句子si,每个句子包含Ti个单词,wit,t∈[1,T]表示第i个句子中的单词;
在词注意力层,引入注意力机制来提取对句子意义重大的词语,并聚合这些词语的表示,形成句子向量;
将步骤5.2获得的hit通过单层感知器获得hit的隐藏表示uit,然后将单词的重要性作为其与单词级上下文向量uw的相似性进行度量,并通过激活函数获得归一化的重要性权重αit;通过基于权重的单词注释的加权和,计算句子向量si;
步骤5.4:将句子向量si输入句编码层,得到隐藏状态和
步骤5.5:拼接和得到句子注释,即
步骤5.6:将隐藏状态hi输入到句注意力层,获得句子级上下文向量ui,并使用该向量来衡量句子的重要性,获得样本向量v,其总结了样本中句子的所有信息;
步骤5.7:将句子v输入到标签引导学习层;
将标签进行表示,其中l为标签,Cl为l的表示向量;然后将句子信息v=[v1,v2,...,vd]投影到标签表示空间,vd表示在d维上的子向量;
计算方式为:其中,ul表示最终的文本序列;d表示v的维度;vj表示第j个子向量;wlj是标签注意力权重,用来衡量标签文本对<vj,Cl>兼容性,兼容性通过余弦相似度计算;
步骤5.8:将ul输入到分类层进行文本分类,获得概率p=softmax(Wcul+bc),Wc表示权重矩阵,bc表示偏置;使用标签的负对数似然作为损失函数,其中,pdj表示获得的概率,j是样本d的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111319941.8/1.html,转载请声明来源钻瓜专利网。