[发明专利]基于汉字分解和特征映射的手写体识别方法及装置在审
申请号: | 202110249693.8 | 申请日: | 2021-05-24 |
公开(公告)号: | CN113159111A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 刘义江;陈蕾;侯栋梁;池建昆;范辉;阎鹏飞;魏明磊;李云超;姜琳琳;辛锐;陈曦;杨青;沈静文;吴彦巧;姜敬;檀小亚;师孜晗 | 申请(专利权)人: | 国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 石家庄新世纪专利商标事务所有限公司 13100 | 代理人: | 呼春辉 |
地址: | 050022 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 汉字 分解 特征 映射 手写体 识别 方法 装置 | ||
本发明公开了基于汉字分解和特征映射的手写体识别方法及装置,涉及手写汉字识别技术领域;方法包括如下步骤S2结构层次化表示,处理器根据汉字结构对单字图片层次化处理并获得汉字层次分解树T;S3嵌入表示,处理器对汉字层次分解树T嵌入表示并获得嵌入表示数据;S4特征提取与映射,处理器将单字图片发送至特征提取器,特征提取器对单字图片提取特征、获得特征向量矩阵M并发送至转换模块,转换模块转换特征向量矩阵M并获得识别结果;装置包括结构层次化表示模块、嵌入表示模块和特征提取与映射模块;其通过步骤S2至步骤S4等,实现了识别手写汉字。
技术领域
本发明涉及手写汉字识别技术领域,尤其涉及一种基于汉字分解和特征映射的手写体识别方法及装置。
背景技术
手写汉字在场景文本识别中一直是一个非常困难的问题,主要是由于手写汉字的多样性,书写方式随意,不规正,无法达到印刷体要求;汉字字符级别比较繁杂,极具变化特点;诸多汉字在外形上相似,容易混淆;要求具备庞大的训练数据,但采集困难,特别是随意性、无约束性手写,对应数据库的构建显得力不从心等特点,因此解决好手写汉字识别可以解决财务报账中签字部分内容,从而判断签字内容是否符合要求,不再需要人工审视;从社会意义可见能够汉字识别技术可以应用于学生作业批改,手写笔记整理等实际场景中。一般而言,常见的手写中文单字识别系统主要包括数据预处理、特征提取和分类识别三部分,但是都非常依赖收集得到的数据,如专利《一种基于STDP的脉冲神经网络手写汉字识别方法CN201910954627.3》即是采用下载离线数据,对离线数据做预处理,确定神经元参数学习分类,这种方法的前提适用条件即是下载的离线数据集,但是如果需要适用于更广阔的手写汉字识别场景,必须要摆脱对于特定数据的依赖。本发明针对上述手写汉字算法过度依赖特定收集的数据的问题,提出了基于汉字拆解和特征映射的手写汉字识别方法。
现有技术问题及思考:
如何解决手写汉字识别困难的技术问题。
发明内容
本发明所要解决的技术问题是提供一种基于汉字分解和特征映射的手写体识别方法及装置,其通过步骤S2至步骤S4等,实现了识别手写汉字。
为解决上述技术问题,本发明所采取的技术方案是:一种基于汉字分解和特征映射的手写体识别方法包括如下步骤,S2结构层次化表示,处理器根据汉字结构对单字图片层次化处理并获得汉字层次分解树T;S3嵌入表示,处理器对汉字层次分解树T嵌入表示并获得嵌入表示数据;S4特征提取与映射,处理器将单字图片发送至特征提取器,特征提取器对单字图片提取特征、获得特征向量矩阵M并发送至转换模块,转换模块转换特征向量矩阵M并获得识别结果。
进一步的技术方案在于:还包括在步骤S2之前的步骤S1汉字分解,处理器从存储器获取文字图片,提取并形成每一汉字的单字图片。
进一步的技术方案在于:在步骤S2中,所述汉字结构包括上下结构、左右结构、左中右结构、上中下结构、全包围结构、上半包围结构、左半包围结构、下半包围结构、右半包围结构和独立结构,共十种汉字结构;在步骤S3中,嵌入表示的步骤包括定义节点的路径长度L为根节点到该节点的最短距离,计算并获得每一个节点的影响因子。
进一步的技术方案在于:在步骤S4中,转换模块将特征向量矩阵M压平为D维向量,然后经过两个全连接层转换为E维向量,选择E中概率值最大的作为识别结果;所述特征提取器为Resnet Blocks的特征提取器,该特征提取器包括四个通道分别是第一至第四通道,第一通道的通道数为64,第二通道的通道数为128,第三通道的通道数为256,第四通道的通道数为512。
一种基于汉字分解和特征映射的手写体识别装置包括如下程序模块,结构层次化表示模块,用于处理器根据汉字结构对单字图片层次化处理并获得汉字层次分解树T;嵌入表示模块,用于处理器对汉字层次分解树T嵌入表示并获得嵌入表示数据;特征提取与映射模块,用于处理器将单字图片发送至特征提取器,特征提取器对单字图片提取特征、获得特征向量矩阵M并发送至转换模块,转换模块转换特征向量矩阵M并获得识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司,未经国网河北省电力有限公司;国网河北省电力有限公司雄安新区供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110249693.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种手套佩戴装置
- 下一篇:基于编解码结构的发票文本识别方法及装置