[发明专利]基于全卷积递归网络的手写汉字文本识别方法有效
申请号: | 201610895498.1 | 申请日: | 2016-10-13 |
公开(公告)号: | CN106570456B | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 马景法;谢泽澄;金连文 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/68;G06N3/08 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 杨晓松 |
地址: | 510640 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于全卷积递归网络的手写汉字文本识别方法,包括步骤路径积分层将联机的笔迹信息转化为相应的脱机特征图片;全卷积网络提取脱机特征图片的高维抽象表达,生成相应的响应图;多层双向递归网络将所述响应图的每一帧完成识别并输出一个关于字符集的概率分布;转录层使用前向计算和反向梯度传播的动态规划算法,使得整个手写汉字文本识别模型可以直接基于文本数据进行训练;和语言模型后处理。本发明对于原联机笔迹信息具有不同程度的刻画能力;在没有对手写汉字文本预分割的情况下,可以接受任意长度的输入序列,并输出一个对应的输出序列;整体性能强;采用集束搜索方法嵌入语言模型解码全卷积递归网络,进一步提高了识别率。 | ||
搜索关键词: | 基于 卷积 递归 网络 手写 汉字 文本 识别 方法 | ||
【主权项】:
1.基于全卷积递归网络的手写汉字文本识别方法,其特征在于,包括步骤:S1:路径积分层将联机的笔迹信息转化为相应的脱机特征图片,包括:S11:对联机手写文本数据的笔迹计算一组路径积分特征,包括:假设一个有限长度笔画段P是二维空间的路径,轨迹移动的时间满足,(0<τ1<...<τk<T),然后计算P的k阶路径积分特征;当P是直线时,用Δ0,T表示路径位移,能够通过分段计算求得;计算n阶路径积分特征,就是把路径积分特征做k阶截断,得到的特征集为得到2n+1维的路径积分特征;步骤S12包括步骤:将路径积分特征的每一个维度单独变成一张路径积分特征图;S12:将每组路径积分特征按照相同维度的特征重组成不同的路径积分特征图;S2:全卷积递归网络提取所述脱机特征图片的高维抽象表达,生成相应的响应图;步骤S2中以任意大小的图片作为输入,并输出相应大小的响应图,该响应图中的每个位置对应着原图的一个接收域,且全卷积递归网络的层与层之间共享卷积响应图;S3:多层双向递归网络将所述响应图的每一帧完成识别并输出一个关于字符集的概率分布;S4:转录层使用前向计算和反向梯度传播的动态规划算法,使得整个手写汉字文本识别模型能够直接基于文本数据进行训练;S5:语言模型后处理,包括:S51:通过综合考虑词法限制、语言的先验知识和语言建模纠正一些显而易见的语义错误;S52:采用集束搜索方式在后处理中嵌入语言模型,提高识别率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610895498.1/,转载请声明来源钻瓜专利网。