[发明专利]一种改进的离线手写汉字识别方法有效
申请号: | 202110802288.4 | 申请日: | 2021-07-15 |
公开(公告)号: | CN113705338B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 邓建华;肖正欣;苟晓攀;何佳霓;代铮;秦琪怡;杨杰;陶泊昊;李龙;赵建恒;郑凯文;魏卓;陈昱辰 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V30/32 | 分类号: | G06V30/32;G06V30/19;G06V10/82;G06N3/045;G06N3/0464;G06N3/084 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 改进 离线 手写 汉字 识别 方法 | ||
本发明公开了一种改进的离线手写汉字识别方法,属于图像识别技术领域。在本发明,由于手写汉字的书写自由度较大,单个汉字中部件与部件之间的组合随意,字形变形程度强。本发明构建的神经网络结构,极大降低了网络计算量,特征通道重排的引入,消除了图像特征通道信息不交流问题,而残差结构的引入,综合不同卷积层对汉字图形特征的表达能力和侧重。在轻量化模型的前提下,增强了通道维度信息间的交流与融合,同时也增强不同层次的特征间的交流与融合,提升了网络模型对离线手写汉字特征复用的能力,提高了模型对离线手写汉字的识别精度。
技术领域
本发明属于图像识别技术领域,具体涉及一种改进的离线手写汉字识别方法。
背景技术
传统的手写汉字识别方法经过多年的研究发展,己逐渐形成了一整套较为完整成熟的流程,主要包括图像预处理,特征提取,分类器识别分类这三个步骤。在传统方法中,特征提取方法可分为两类,分别是基于结构特征的方法和基于统计特征的方法。在识别分类阶段中也有很多分类方法。常用的传统分类器有K最近邻算法KNN、贝叶斯分类器、支持向量机SVM、决策树、随机森林等。传统方法往往需要大量的汉字图像样本和特征信息,在实际中非常依赖人工。第二是通过人工确定的特征不能准确地反映图像的深度特征表达。
发明内容
本发明所要解决的技术问题是提供一种结合改进残差结构和VGGnet的离线手写汉字识别方法,解决现有传统识别方法存在的依赖人工和提取图像特征信息不准确的技术问题,有效地实现离线手写汉字的识别分类。
本发明采用的技术方案为:
一种改进的离线手写汉字识别方法,包括下列步骤:
步骤1:设置手写汉字识别的汉字类别数,以及设置训练数据集,所述训练数据包括手写汉字图像和汉字标签;
步骤2:构建及训练手写汉字识别网络;
所述手写汉字识别网络的结构采用VGG16作为基础网络,并将VGG16的全连接层减少至两层,在基础网络的每层卷积层后增加BN-ReLU结构,其中每一层网络层的步长均设置为1,填充值设置为1;
所述手写汉字识别网络包括四个卷积块:卷积模块1至2、带有残差结构的卷积模块3至5,其中,卷积模块1和2的网络结构相同,两层堆叠的带有BN-ReLU结构的卷积层;带有残差结构的卷积模块3、4和5的网络结构相同,包括主路和旁路两条支路,所述主路和旁路的输出特征图相加和后,再经ReLU激活函数层得到带有残差结构的卷积模块的输出特征图;其中,所述主路依次包括:带有BN-ReLU结构的卷积层、通道重排层、三层堆叠的带分组卷积的卷积单元,所述带分组卷积的卷积单元为带有BN-ReLU结构的卷积层,且卷积层采用采用分组卷积方式进行卷积运算(在卷积运算前,先将特征图进行通道维度的分组,然后分别对分组特征图进行卷积运算)和通道重排层;所述旁路为跳跃连接的旁路,包括一层带有BN-ReLU结构的卷积层;
所述手写汉字识别网络的最后一层全连接层的输出维度与手写汉字识别的汉字类别数一致,所述Softmax层用于输出每个汉字类别的预测概率;
对所述训练数据集中的手写汉字图像的尺寸进行归一化处理,以与手写汉字识别输入相匹配,再基于预置的批训练大小,按批次将写汉字图像输入手写汉字识别网络进行网络参数训练,当满足预置的训练结束条件时,得到训练好的手写汉字识别网络;
步骤3:对待识别图像进行图像预处理,再将待识别图像输入到训练好的手写汉字识别网络,基于Softmax层输出的每个汉字类别的预测概率中的最大项确定待识别图像的手写汉字识别结果,其中,所述图像预处理包括:灰度转换和尺寸归一化处理。
进一步的,所述通道重排层用于在分组数维度和分组通道数维度上进行转置运算,再展平得到通道重排层的输出特征图。
本发明提供的技术方案至少带来如下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110802288.4/2.html,转载请声明来源钻瓜专利网。