[发明专利]一种基于循环注意力机制的文档快速扫描定性方法有效

专利信息
申请号: 201711350432.5 申请日: 2017-12-15
公开(公告)号: CN108170736B 公开(公告)日: 2020-05-05
发明(设计)人: 杨维永;张宁;马超;刘凯乐;何军;赖业宁;季叶飞;朱进;从正海;朱世顺;郭靓;林学峰 申请(专利权)人: 南瑞集团有限公司;国家电网公司;南京信息工程大学;国网江苏省电力有限公司
主分类号: G06F16/36 分类号: G06F16/36
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 董建林
地址: 211106 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于循环注意力机制的文档快速扫描定性方法,获取训练数据集,在预处理阶段,将整个文档转换为词向量矩阵,词向量矩阵通过含有循环注意力机制的文档检测模型,包括卷积神经网络模块、最大池化模块、循环神经网络模块,利用回报函数得出回报值reward,训练循环神经网络,优化模型参数,测试模型准确率。本发明的方法基于注意力机制,引入了强化学习的训练方法,适应性更强,并且不需要对全文进行检索,而是通过处理文档中的局部信息,智能快速的预测出文档中特定的位置,在有限的次数内,快速扫描探索找出最能够代表文档特征的句子,即分类概率最大的句子,这些句子能够最大化的表示该文档的类型。
搜索关键词: 一种 基于 循环 注意力 机制 文档 快速 扫描 定性 方法
【主权项】:
1.一种基于循环注意力机制的文档快速扫描定性方法,其特征在于,包括以下步骤:

(1)获取训练数据集,拟定训练数据集中的文档的标签;

(2)在预处理阶段,将文档分成句子,再对句子进行分词,然后对每一个词使用word2vec词向量训练模型转化为词向量,由此将句子转化成一个由词向量组成的矩阵,从而将整个文档转换为词向量矩阵;

(3)将词向量矩阵输入文档检测模型,所述文档检测模型包括卷积神经网络模块、最大池化模块和循环神经网络模块,具体步骤为:

31)随机选取一个位置t,利用一个一维的卷积神经网络提取位置t的句子的每个词的语义信息特征,再经过最大池化降维,输出每个句子的特征向量;

32)将每个句子的特征向量和上个时间步骤输出的隐含状态ht‑1一起输入到循环神经网络中进行编码,然后输出当前时间的隐含状态ht

33)将循环神经网络输出的隐含状态ht输入到一个强化学习模块,输出对下一个位置的索引预测Lt+1

34)找到下一个位置t+1,将位置t+1的句子输入到一个一维的卷积神经网络,提取每个词的特征,随后经过最大池化降维得到特征向量,然后,再将上一步输出的位置索引预测Lt+1与特征向量通过一个RELU修正线性单元模块进行线性加和,再输入到循环神经网络之中;

35)循环神经网络运行到最后一步时,输出的隐含状态输入到一个分类器,输出整篇文档的标签分布概率P;

(4)利用回报函数得出回报值reward;

(5)训练循环神经网络,优化文档检测模型参数;

(6)获取测试数据集,拟定测试数据集中的文档的标签,测试文档检测模型准确率。

2.根据权利要求1所述的基于循环注意力机制的文档快速扫描定性方法,其特征在于,步骤(3)中卷积神经网络的卷积核个数为256。

3.根据权利要求1所述的基于循环注意力机制的文档快速扫描定性方法,其特征在于,在步骤(4)中,回报函数的数据处理流程为:

a)步骤(3)中输出的标签分布概率P为一组和为1的数组,数组中较大的概率值所对应的下标即为预测的文档标签,同时输出含有预测的文档标签的句子,作为代表文档特征的句子;

b)将步骤a)中得到的预测的文档标签与步骤(1)中的文档的标签作比对,如果相同则回报值reward的值为1,不同则回报值reward的值为0。

4.根据权利要求1所述的基于循环注意力机制的文档快速扫描定性方法,其特征在于,步骤(5)中的训练优化的目标是最优化目标函数,最小化代价函数,代价函数包括分类的代价函数和强化学习的代价函数,具体步骤为:

(41)分类的代价函数为交叉熵函数:利用一组已知标签的样本调整分类器的参数,使代价函数即交叉熵函数最小,利用预测的文档的标签和步骤(1)中文档的标签,计算出交叉熵C,其中,x表示样本,n表示样本的总数,y为期望的输出,即文档的标签值,a为神经元实际输出,即预测的文档标签值,训练时将交叉熵对权重的偏导数反向传播,更新文档检测模型参数;

(42)强化学习的代价函数为L(θ)=logπ(a|s,θ)·(R‑b),其中π(a|s)为神经网络拟合的策略,θ为参数;logπ(a|s,θ)是在状态s下输出动作a的概率的对数似然,用以表示智能体的策略,b为基线baseline,R为回报值reward;再利用自适应矩估计Adam优化器反向更新文档检测模型参数,优化强化学习的代价函数,使代价函数最小化,回报值reward最大化。

5.根据权利要求4所述的基于循环注意力机制的文档快速扫描定性方法,其特征在于,训练文档检测模型时,设置步数step为100000步,样本总数为1000,每一个分批处理mini_batch的样本数量为10,训练开始时的学习率learning rate为10‑3,设置衰减因子λ,在每一次训练完全部样本之后,学习率learning rate按照衰减因子λ衰减,随着训练进行,最后学习率learning rate变为10‑4

6.根据权利要求1所述的基于循环注意力机制的文档快速扫描定性方法,其特征在于,步骤(6)中,将得出的预测的文档标签与测试数据集中的文档的标签对比,如果相同则回报值reward为1,测试一系列文档之后得出回报值reward的加和,再除以文档数量,得到整个测试文档的分类准确率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南瑞集团有限公司;国家电网公司;南京信息工程大学;国网江苏省电力有限公司,未经南瑞集团有限公司;国家电网公司;南京信息工程大学;国网江苏省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711350432.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top