[发明专利]一种改进的离线手写汉字识别方法有效
申请号: | 202110802288.4 | 申请日: | 2021-07-15 |
公开(公告)号: | CN113705338B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 邓建华;肖正欣;苟晓攀;何佳霓;代铮;秦琪怡;杨杰;陶泊昊;李龙;赵建恒;郑凯文;魏卓;陈昱辰 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V30/32 | 分类号: | G06V30/32;G06V30/19;G06V10/82;G06N3/045;G06N3/0464;G06N3/084 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 改进 离线 手写 汉字 识别 方法 | ||
1.一种改进的离线手写汉字识别方法,其特征在于,包括下列步骤:
步骤1:设置手写汉字识别的汉字类别数,以及设置训练数据集,所述训练数据包括手写汉字图像和汉字标签;
步骤2:构建及训练手写汉字识别网络;
所述手写汉字识别网络以VGG16作为基础网络,并将VGG16的全连接层减少至两层,在基础网络的每层卷积层后增加BN-ReLU结构,其中每一层网络层的步长均设置为1,填充值设置为1;
所述手写汉字识别网络包括四个卷积块:卷积模块1至2、带有残差结构的卷积模块3至5,其中,卷积模块1和2的网络结构相同,两层堆叠的带有BN-ReLU结构的卷积层;带有残差结构的卷积模块3、4和5的网络结构相同,包括主路和旁路两条支路,所述主路和旁路的输出特征图相加和后,再经ReLU激活函数层得到带有残差结构的卷积模块的输出特征图;其中,所述主路依次包括:带有BN-ReLU结构的卷积层、通道重排层、三层堆叠的带分组卷积的卷积单元,所述带分组卷积的卷积单元为带有BN-ReLU结构的卷积层,且卷积层采用分组卷积方式进行卷积运算和通道重排层;所述旁路为跳跃连接的旁路,包括一层带有BN-ReLU结构的卷积层;
所述手写汉字识别网络的最后一层全连接层的输出维度与手写汉字识别的汉字类别数一致, Softmax层用于输出每个汉字类别的预测概率;
对所述训练数据集中的手写汉字图像的尺寸进行归一化处理,以与手写汉字识别输入相匹配,再基于预置的批训练大小,按批次将写汉字图像输入手写汉字识别网络进行网络参数训练,当满足预置的训练结束条件时,得到训练好的手写汉字识别网络;
步骤3:对待识别图像进行图像预处理,再将待识别图像输入到训练好的手写汉字识别网络,基于Softmax层输出的每个汉字类别的预测概率中的最大项确定待识别图像的手写汉字识别结果,其中,所述图像预处理包括:灰度转换和尺寸归一化处理。
2.如权利要求1所述的方法,其特征在于,所述通道重排层用于在分组数维度和分组通道数维度上进行转置运算,再展平得到通道重排层的输出特征图。
3.如权利要求1所述的方法,其特征在于,基于公布的手写单字符汉字数据集设置训练数据集。
4.如权利要求1所述的方法,其特征在于,将每层卷积层的卷积核大小设置为3×3,按照前向传播的方向,依次将每层的卷积核个数设置为:64、64、128、128、256、256、256、512、512、512、512、512、512;以及将带分组卷积的卷积单元的分组数设置为4。
5.如权利要求1所述的方法,其特征在于,按照前向传播的方向,将所述手写汉字识别网络的3个带有残差结构的卷积模块的输入和输出通道数依次设置为:(64,256)、(128,512)、(256,512),且旁路的卷积核大小均设置为1×1,各带有残差结构的卷积模块的旁路的输出通道数依次设置为:256、512、512。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110802288.4/1.html,转载请声明来源钻瓜专利网。