[发明专利]基于神经网络和注意力机制结合的文字识别系统及方法有效
申请号: | 201811230112.0 | 申请日: | 2018-10-22 |
公开(公告)号: | CN109389091B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 杨宏志;庞宇;王慧倩 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V30/41;G06V10/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红;陈栋梁 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明请求保护一种基于神经网络和注意力机制结合的文字识别系统及方法,具体包括:卷积神经网络特征提取模块,用于文字图像的空间特征;将卷积神经网络提取的空间特征输入到双向长短期记忆网络模块,双向长短期记忆网络能够提取文字的序列特征;将提取的特征向量进行语义编码,然后通过注意力机制分配特征向量的注意力权值,让注意力集中在权值较高的特征向量;模型的解码部分,通过嵌套长短期记忆网络实现,将注意力提取到的特征和前一时刻的预测信息作为嵌套长短期记忆网络的输入,前后均采用长短期记忆网络的目的是为了保持特征向量的时间特性,使模型注意位置点随着时间不断变化;本发明能够更准确的检测自然场景中的文字区域,并且对小目标文字和倾斜角度小的文本有很好的检测效果。 | ||
搜索关键词: | 基于 神经网络 注意力 机制 结合 文字 识别 系统 方法 | ||
【主权项】:
1.一种基于神经网络和注意力机制结合的文字识别系统,其特征在于,包括:特征提取模块、编码和注意力模块及解码模块,其中,特征提取模块采用的是卷积神经网络和双向长短期记忆网络相结合的结构,所述卷积神经网络用于提取文字图像的空间特征;所述双向长短期记忆网络用于提取文字的序列特征;编码和注意力模块,用于对双向长短期记忆网络编码阶段的隐藏状态hi进行加权求和,获取不同时刻的注意力权值,然后通过注意力聚焦对当前时刻的输出作预测;解码模块采用的是嵌套长短期记忆网络,解码部分是对编码生成的中间语义信息进行解析,解码需要利用注意力机制对编码的状态进行注意力聚焦,然后通过嵌套长短期记忆网络学习过去某时刻的解码信息,用于提取文本的序列信息,通过前一时刻的状态预测当前时刻的输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811230112.0/,转载请声明来源钻瓜专利网。