[发明专利]联机手写汉字识别算法及可视化关键笔画评估方法在审
申请号: | 202011015320.6 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112132050A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 任海青;杨林;王浩枫;芦存博 | 申请(专利权)人: | 北京计算机技术及应用研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 中国兵器工业集团公司专利中心 11011 | 代理人: | 王雪芬 |
地址: | 100854*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联机 手写 汉字 识别 算法 可视化 关键 笔画 评估 方法 | ||
1.一种联机手写汉字识别算法及可视化关键笔画评估方法,其特征在于,包括:
第一步、联机手写汉字识别阶段,具体流程为:
(1)数据预处理模块接收联机手写汉字字符原始轨迹坐标序列,对坐标数据进行预处理;
(2)基于神经网络的特征提取模块,接收数据预处理模块处理过的坐标数据,即字符样本坐标序列,经过递归神经网络的计算生成对应各个时刻的神经网络顶层状态向量,即字符样本特征;
(3)局部自注意力模块接收基于神经网络的特征提取模块产生的状态向量,经过计算生成各时刻顶层状态向量对应的权值,并结合权值计算所有状态向量的加权和;
(4)分类模块接收局部自注意力模块输出的结果,通过softmax分类器基于神经网络的特征提取模块提取的字符样本特征进行分类;
第二步、联机手写汉字关键笔画可视化评估阶段,具体流程为:
(1)权值二值化模块接收局部自注意力机制模块产生的权值信息,设定特定的阈值,将接收到的权值二值化;
(2)关键笔画显示模块,是结合权值二值化模块二值化后的权重信息以及数据预处理模块处理过的字符样本轨迹坐标数据,将输入字符样本的关键笔画显示出来,对当前的输入字符样本的坐标轨迹点的重要程度做一个可视化的评估。
2.如权利要求1所述的方法,其特征在于,所述数据预处理模块对坐标数据进行预处理,包括坐标归一化、坐标点下采样。
3.如权利要求2所述的方法,其特征在于,所述基于神经网络的特征提取模块,是一个门控循环单元类型的递归神经网络。
4.如权利要求3所述的方法,其特征在于,所述分类模块包含一个全连接层和一个softmax分类器。
5.如权利要求4所述的方法,其特征在于,所述关键笔画显示模块是一个基于opencv的显示模块,将二值化权重作为一个mask,与字符样本坐标序列相乘,即将字符坐标序列中对应权重为0的坐标点擦除,并将最终的结果显示出来。
6.如权利要求5所述的方法,其特征在于,所述数据预处理模块的实现方法具体包括:
(1)对于给定的字符,字符坐标序列中所有坐标点(mt,nt)都归一化到[0,64]的范围之内,t=1,2,…,T;T为整数;
(2)将字符的坐标序列进一步归一化,使得所有的坐标点的均值为0,即其中,和分别代表相应所有横坐标m′t和纵坐标n′t的平均值,在后续出现的所有mt和nt均表示经过预处理之后的数据。
7.如权利要求6所述的方法,其特征在于,所述基于神经网络的特征提取模块的实现方法包括:
对于联机手写汉字样本,原始数据其实是一系列点坐标的序列,以联机手写汉字样本的坐标点序列为系统的输入,x=(x1,x2,...,xt,...,xT),其中,xt=(mt,nt),mt和nt分别代表坐标点序列在时刻t的横坐标和纵坐标,将这些坐标点送入递归神经网络进行计算,在神经网络的顶层得到一系列的隐含层状态向量,在每个时刻,神经网络计算过程如下:
其中,表示在时刻t,第n层的隐含层状态向量,表示计算第一个隐含层的函数,表示计算第n个隐含层的函数,θ1,θn表示相应层的神经网络的参数,经过T个时刻的迭代,在神经网络的顶层产生T个隐含层状态
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京计算机技术及应用研究所,未经北京计算机技术及应用研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011015320.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种口罩消毒烘干装置
- 下一篇:一种提高牛蛙蝌蚪前期成活率的方法