[发明专利]一种无切分的脱机手写汉字文本识别方法在审
申请号: | 201810239934.9 | 申请日: | 2018-03-22 |
公开(公告)号: | CN108509881A | 公开(公告)日: | 2018-09-07 |
发明(设计)人: | 应自炉;陈鹏飞;朱健菲;陈俊娟;甘俊英;翟懿奎 | 申请(专利权)人: | 五邑大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 吴伟文 |
地址: | 529020 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 构建 预处理 循环神经网络 汉字 空间变换 文本识别 文本行 迭代算法 概率分布 规则搜索 模型参数 模型框架 模型提取 深度特征 输出序列 贪婪搜索 网络模型 文本图像 校正处理 偏移 分类器 鲁棒性 准确率 求解 字典 标签 文本 优化 网络 联合 | ||
1.一种无切分的脱机手写汉字文本识别方法,其特征在于,包括以下步骤:
S1)、对脱机手写汉字文本图像进行预处理,预处理包括图像尺寸归一化处理、以及图像亮度值反转;
S2)、构建空间变换网络模型,通过该空间变换网络模型校正文本图像的偏移,该空间变换网络模型由定位网络、采样栅格、采样器构成;
S3)、构建深度卷积神经网络模型,通过该模型提取校正偏移文本图像的深度特征;
S4)、通过深度卷积神经网络模型提取的深度特征构建循环神经网络模型,通过该模型对深度序列特征建模;
S5)、通过联结主义时间分类器CTC输出序列特征标签的概率分布,得到初步的识别结果;
S6)、采用贪婪搜索和基于字典规则搜索得到文本最终的识别结果。
2.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:所述的步骤S1)中,通过图像尺寸归一化处理将文本图像宽度处理为128,并通过图像亮度值反转将文本图像背景和汉字亮度进行反转,具体为:I(i,j)=255-X(i,j),其中,X(i,j)为文本图像第i行第j列像素位置对应的亮度值,I(i,j)为转后文本图像第i行第j列像素位置的亮度值。
3.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S2)中,具体包括以下步骤:
S201)、将预处理后的文本图像输入定位网络中,计算得到仿射变换参数θ,即θ=floc(I),其中,floc(I)是一个2层的全连接网络,I为预处理后的文本行图像;
S202)、通过仿射变换参数θ得到文本图像的坐标栅格坐标点的仿射变换如下:
其中,是输入文本图像的采样点坐标,Aθ为仿射变换矩阵,为输出栅格的坐标,并且,和当仿射变换矩阵其中,s为缩放分量,tx,ty为输出栅格像素坐标的偏移量,该变换矩阵可以实现裁剪、缩放、平移、旋转和倾斜等变换操作,这些变换实现了空间的注意力机制,使得变换后的图像更关注主要内容信息;
S203)、将文本图像的坐标栅格坐标与文本图像Y输入到采样器,得到校正偏移的文本图像V,即V=fsam(I,Tθ(G)),其中,fsam为采样器函数。
4.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S3)中,构建的深度卷积神经网络模型为一个18层的残差深度卷积神经网络,残差网络的学习表达式为:
F(x)=H(x)-x,
其中,F(x)为残差映射,H(x)为原始映射,从而根据残差网络结构y=F(x,{Wi})+x,提取图像特征y,其中,Wi为权值参数,x为输入。
5.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S4)中,所述的循环神经网络模型为2层双向的GRU(Gate Recurrent Unit)网络。
6.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S5)中,分类器CTC的映射关系为:通过CTC层输出每一帧序列特征数据的识别概率分布,其中,p(k|y)为序列特征k在序列特征y下的条件概率,p(l|y)为序列特征l在序列特征y下的条件概率,β(k)=l为序列k到序列y的映射,y=y1,...,yT为输入的特征序列,每一个L′是包含所有识别的字符集和一个空白符号,CTC在输出序列时,移除重复项以及空白项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五邑大学,未经五邑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810239934.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视频人物行为语义识别方法
- 下一篇:轨道泥石流检测方法和装置