[发明专利]一种手写汉字识别方法、装置及存储介质在审

申请号：	202011102640.5	申请日：	2020-10-15
公开（公告）号：	CN112232195A	公开（公告）日：	2021-01-15
发明（设计）人：	薛晗庆;潘红九;陈政;梁宇;窦小明;金娜;薛凯;顾天祺;张建;雷净;于雪洁;赵俊翔;底亚峰;封慧英;李萌萌	申请（专利权）人：	北京临近空间飞行器系统工程研究所
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06F16/31;G06N3/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	100076 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种手写汉字识别方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种手写汉字识别方法、装置及存储介质，用于提高文档扫描类图像的手写汉字体识别的可靠性和效率。本申请提供的手写汉字识别方法包括：构建网络结构；输入待识别的汉字序列图像；确定所述网络结构中各层网络的权重参数；根据所述权重参数，在所述网络结构中计算所述待识别的汉字序列图像，确定标签序列，其中所述标签序列包括汉字概率信息；根据所述标签序列和汉字词库表，进行汉字反映射，确定识别出的汉字。本申请还提供了一种手写汉字识别装置及存储介质。

技术领域

本申请涉及信息处理领域，尤其涉及一种手写汉字识别方法和装置。

背景技术

随着可视内容数据的增加，在在拍照文档、票据、表单表格、手稿文书、教育材料等领域的手写汉字识别需求不断增加。非手写汉字在图像或视频中主要以印刷体或者水印形式呈现，对于每一段序列文字其字形偏旁、字与段落的间距等格式较为统一，而手写汉字字体由于个人的书写风格不同，导致不同人群书写出的同一汉字的形体有所差异，对于初识汉字的少儿字体差异更为显著，因此手写汉字的识别难度较非手写汉字的识别难度更大。现有技术中，先对单个文字进行切割，再将切割后的文字逐个提取特征并与特征库进行匹配识别，效率较低，可靠性较差。

发明内容

针对上述技术问题，本申请实施例提供了一种手写汉字识别方法、装置及存储介质，用以提高手写汉字的识别效率和可靠性。

第一方面，本申请实施例提供的一种手写汉字识别方法，包括：

构建网络结构；

输入待识别的汉字序列图像；

确定所述网络结构中各层网络的权重参数；

根据所述权重参数，在所述网络结构中计算所述待识别的汉字序列图像，确定标签序列，其中所述标签序列包括汉字概率信息；

根据所述标签序列和汉字词库表，进行汉字反映射，确定识别出的汉字。

进一步的，所述确定所述网络结构中各层网络的权重参数包括：

按批次加载训练数据；

将所述训练数据输入到所述网络结构中进行计算，确定汉字类别概率矩阵；

根据训练数据的标签序列和所述概率矩阵，通过损失函数运算得到误差值；