[发明专利]基于Gabor卷积和线性稀疏注意力的文字识别系统在审
申请号: | 202110642032.1 | 申请日: | 2021-06-09 |
公开(公告)号: | CN113221874A | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 徐源;黄征;陈凯;周异 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06N3/04;G06N3/08 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 一种基于Gabor卷积和线性稀疏注意力的场景文字识别系统,包括:空间矫正模块、Gabor特征提取模块和线性稀疏注意力模块,空间矫正模块对输入的场景文字图像进行矫正,Gabor特征提取模块从矫正图像中提取出Gabor特征和卷积特征,经融合后输出至线性稀疏注意力模块进行编解码从而实现文字识别。本发明能够有效捕获场景文字图像各字符对象的方向和纹理变化特征,在提取目标的局部空间和频率域信息方面具有良好的特性。采用自注意力机制替代循环神经网络结构,由此具备了良好的并行计算的能力,加快了训练和推理速度。同时在自注意力机制中引入稀疏注意力的思想,解决了模型随着长度的增加,注意力部分所占用的内存和计算呈平方比增加的问题,同时有助于将引起注意的部分被保留下来,而忽视其他无关的信息。并且在稀疏注意力中加入线性关系约束,一定程度上可以缓解注意力偏移的问题,使得文字识别更加精准。 | ||
搜索关键词: | 基于 gabor 卷积 线性 稀疏 注意力 文字 识别 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110642032.1/,转载请声明来源钻瓜专利网。