[发明专利]手写字符识别方法、装置、介质及电子设备在审
申请号: | 202110587664.2 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113297986A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 尹成浩;张飞飞;马志国;张明;杨明坤 | 申请(专利权)人: | 新东方教育科技集团有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 李柯莹 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写 字符 识别 方法 装置 介质 电子设备 | ||
1.一种手写字符识别方法,其特征在于,所述方法包括:
获取包含手写字符的原始字符图像;
将所述原始字符图像输入到图像校正模型中,得到所述图像校正模型输出的校正后的目标字符图像;
将所述目标字符图像输入到特征提取模型中,得到所述特征提取模型输出的目标特征图,其中,所述特征提取模型用于对所述目标字符图像的高度下采样第一预设倍数,并用于对所述目标字符图像的宽度下采样第二预设倍数,所述第一预设倍数与所述目标字符图像的高度相同,所述第二预设倍数小于所述第一预设倍数;
将所述目标特征图输入到字符识别模块中,得到所述字符识别模块输出的所述手写字符对应的识别字符。
2.根据权利要求1所述的方法,其特征在于,所述特征提取模型为残差网络模型,所述残差网络模型由以下网络层依次连接构成:
第一卷积层、第一池化层、第一数量个第一残差块结构、第二卷积层、第二池化层、第二数量个第二残差块结构、第三卷积层、第三池化层、第三数量个第三残差块结构、第四卷积层、第四池化层、第四数量个第四残差块结构、第五卷积层、第五数量个第五残差块结构、第六卷积层、第七卷积层,所述第七卷积层用于输出所述目标特征图。
3.根据权利要求2所述的方法,其特征在于,
所述第一池化层用于对所述第一卷积层输出的特征图的宽度和高度均下采样第三预设倍数,所述第二池化层用于对所述第二卷积层输出的特征图的宽度和高度均下采样所述第三预设倍数,所述第三池化层用于对所述第三卷积层输出的特征图的高度下采样所述第三预设倍数,并对所述第三卷积层输出的特征图的宽度进行卷积填充第一预设值,所述第四池化层用于对所述第四卷积层输出的特征图的高度下采样所述第三预设倍数,并对所述第四卷积层输出的特征图的宽度进行卷积填充所述第一预设值,其中,所述第三预设倍数小于所述第二预设倍数。
4.根据权利要求2所述的方法,其特征在于,所述第一卷积层、所述第二卷积层、所述第三卷积层、所述第四卷积层、所述第五卷积层的卷积核大小相同且卷积核数量各不相同,所述第六卷积层与所述第七卷积层的卷积核大小相同且卷积核数量相同;
其中,所述第六卷积层用于对位于所述第六卷积层上一层的所述第五残差块结构输出的特征图的高度下采样第四预设倍数,并用于对位于所述第六卷积层上一层的所述第五残差块结构输出的特征图的宽度进行卷积填充第二预设值,所述第七卷积层用于对所述第六卷积层输出的特征图的高度下采样所述第四预设倍数,其中,所述第四预设倍数小于所述第二预设倍数。
5.根据权利要求2所述的方法,其特征在于,
所述第一残差块结构、所述第二残差块结构、所述第三残差块结构、所述第四残差块结构、所述第五残差块结构的卷积核大小相同,
所述第一残差块结构、所述第二残差块结构、所述第三残差块结构的卷积核数量各不相同,所述第四残差块结构与所述第五残差块结构的卷积核数量相同。
6.根据权利要求1所述的方法,其特征在于,所述目标字符图像的高度为64,所述第一预设倍数为64倍,所述第二预设倍数为4倍。
7.根据权利要求1所述的方法,其特征在于,所述图像校正模型用于通过如下方式得到所述目标字符图像:
确定所述原始字符图像中、位于所述手写字符的上边缘和下边缘的指定数量个基准点;
根据所述指定数量个基准点进行样条变换,得到采样网格;
基于所述采样网格进行双线性插值采样,得到校正后的所述目标字符图像。
8.根据权利要求1所述的方法,其特征在于,所述字符识别模块包括编码模块和解码模块;其中,所述编码模块包括双层双向长短期记忆网络,所述双层双向长短期记忆网络用于对所述目标特征图进行特征编码处理,得到序列特征;
所述解码模块包括链接时序分类模型和注意力机制模型,所述链接时序分类模型和所述注意力机制模型分别根据所述序列特征对所述手写字符进行识别,所述解码模块用于将所述链接时序分类模型输出的识别结果与所述注意力机制模型输出的识别结果进行加权融合,得到所述手写字符对应的识别字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新东方教育科技集团有限公司,未经新东方教育科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110587664.2/1.html,转载请声明来源钻瓜专利网。