[发明专利]基于神经网络和注意力机制结合的文字识别系统及方法有效

专利信息
申请号: 201811230112.0 申请日: 2018-10-22
公开(公告)号: CN109389091B 公开(公告)日: 2022-05-03
发明(设计)人: 杨宏志;庞宇;王慧倩 申请(专利权)人: 重庆邮电大学
主分类号: G06V10/774 分类号: G06V10/774;G06V30/41;G06V10/46;G06K9/62;G06N3/04;G06N3/08
代理公司: 重庆市恒信知识产权代理有限公司 50102 代理人: 刘小红;陈栋梁
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 神经网络 注意力 机制 结合 文字 识别 系统 方法
【权利要求书】:

1.一种基于神经网络和注意力机制结合的文字识别系统,其特征在于,包括:特征提取模块、编码和注意力模块及解码模块,其中,特征提取模块采用的是卷积神经网络和双向长短期记忆网络相结合的结构,所述卷积神经网络用于提取文字图像的空间特征;所述双向长短期记忆网络用于提取文字的序列特征;

编码和注意力模块,用于对双向长短期记忆网络编码阶段的隐藏状态hi进行加权求和,获取不同时刻的注意力权值,然后通过注意力聚焦对当前时刻的输出作预测;

解码模块采用的是嵌套长短期记忆网络,解码部分是对编码生成的中间语义信息进行解析,解码需要利用注意力机制对编码的状态进行注意力聚焦,然后通过嵌套长短期记忆网络学习过去某时刻的解码信息,用于提取文本的序列信息,通过前一时刻的状态预测当前时刻的输出;

所述卷积神经网络模块包括卷积层1、池化层1、卷积组2、卷积层3、池化层2、卷积层4、池化层3、批量标准层、卷积层5、池化层4、批量标准层、Dropout层组成;

所述卷积神经网络详细参数设置如下:所述卷积层1的卷积核大小为5×5×64,步长为1,扩充边缘为1,池化层均采用均值方法,其参数设置一样,皆为:核大小3×3,步长为2,扩充边缘为0;所述卷积组2包括并行的卷积核为7×7卷积层A和卷积核为5×5卷积层B、以及层叠在并行的卷积层后的卷积核为1×1×C的卷积层C1,C表示卷积核个数,调节C的大小可以降低维度,使计算速度加快,计算成本降低;所述卷积层3,4,5均采用大小3×3的卷积核,卷积核个数为128,128,256,卷积核步长为1,扩充边缘为1;所述批量标准层是对每个小批量数据进行标准化,将数据通过计算均值和方差,然后归一化,然后平移缩放参数;所述Dropout层可以看作一个模型的随机求和然后平均,就是将隐藏单元随机丢失;

所述编码和注意力模块具体包括:语义编码Ci是注意力模型的关键点,将双向循环神经网络生成的1×1024的特征向量序列进行语义编码,其目的是对编码阶段的隐藏状态hi进行加权求和,获取不同时刻的注意力权值,然后通过注意力聚焦对当前时刻的输出作预测,采用注意力机制取T的长度为20的向量的特征序列S进行特征聚焦,预测最后一个文字时,会将注意力集中在当前时刻的输入文本以及过去某一时刻的隐藏状态,注意力模型的权值会分布在不同时刻的隐藏状态,权值越大,注意力就越集中,注意力模型中[x1,x2,x3,...xT]表示当前时刻输入,At,i表示的是注意力的聚焦权值,Ct表示的是在t时刻对特征hi的加权值;

所述At,i、Ct具体公式如下表示:

et,i=fatt(st-1,hi) (15)

st=f(st-1,yt-1,Ct) (16)

yt=g(yt-1,st,Ct) (17)

fatt(st-1,hi)是关联程度函数,表示解码的t-1时刻的状态与编码特征b的关联程度,yt表示解码模块的预测输出,g(yt-1,st,Ct)表示概率输出函数;

所述解码模块采用的是嵌套长短期记忆网络,用于对注意力聚焦后的特征向量进行识别,其中第t时刻的输入就是第t次特征聚焦后的特征向量,嵌套长短期记忆网络使用标准的长短期记忆网络门选择性地进行读取、编写,解码后某一时刻t的预测输出yt由过去时刻预测输出yt-1、解码器的隐藏状态st、注意力权值Ct共同决定,其记忆单元函数公式如下:

Cet=IMt(ft☉Cet-1,it☉gt) (18)

ft表示前向传播的非线性函数表示,IMt表示嵌套长短期记忆网络的内部记忆状态,Cet-1表示上一时刻t-1记忆单元的状态,gt表示长短期记忆网络的门控函数;

最后,输出采用Softmax以概率的形式表示,然后选取概率值最大的作为预测结果,对于长短期记忆网络每个时刻t都有预测值,然后将值按照时刻顺序取结束符之前的字符组成字符串,就是所要的结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811230112.0/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top