[发明专利]一种无切分的脱机手写汉字文本识别方法在审

专利信息
申请号: 201810239934.9 申请日: 2018-03-22
公开(公告)号: CN108509881A 公开(公告)日: 2018-09-07
发明(设计)人: 应自炉;陈鹏飞;朱健菲;陈俊娟;甘俊英;翟懿奎 申请(专利权)人: 五邑大学
主分类号: G06K9/00 分类号: G06K9/00;G06N3/04;G06N3/08
代理公司: 广州市红荔专利代理有限公司 44214 代理人: 吴伟文
地址: 529020 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种无切分的脱机手写汉字文本识别方法,包括S1)对脱机手写汉字文本图像进行预处理;S2)构建空间变换网络模型;S3)构建深度卷积神经网络模型;S4)通过深度卷积神经网络模型提取的深度特征构建循环神经网络模型;S5)通过分类器CTC输出序列征标签的概率分布;S6)采用贪婪搜索和基于字典规则搜索得到文本最终的识别结果。本发明通过采用空间变换网络、深度卷积神经网络和循环神经网络相结合的模型,能够针对偏移较大文本行进行校正处理和无切分的识别,提高复杂文本行识别的准确性和鲁棒性;整个模型框架基于迭代算法求解,不需要复杂的过切分预处理,能够较好地减少过切分方法带来的损失,以及能够联合地优化整个模型参数,提高识别的准确率。
搜索关键词: 卷积神经网络 构建 预处理 循环神经网络 汉字 空间变换 文本识别 文本行 迭代算法 概率分布 规则搜索 模型参数 模型框架 模型提取 深度特征 输出序列 贪婪搜索 网络模型 文本图像 校正处理 偏移 分类器 鲁棒性 准确率 求解 字典 标签 文本 优化 网络 联合
【主权项】:
1.一种无切分的脱机手写汉字文本识别方法,其特征在于,包括以下步骤:S1)、对脱机手写汉字文本图像进行预处理,预处理包括图像尺寸归一化处理、以及图像亮度值反转;S2)、构建空间变换网络模型,通过该空间变换网络模型校正文本图像的偏移,该空间变换网络模型由定位网络、采样栅格、采样器构成;S3)、构建深度卷积神经网络模型,通过该模型提取校正偏移文本图像的深度特征;S4)、通过深度卷积神经网络模型提取的深度特征构建循环神经网络模型,通过该模型对深度序列特征建模;S5)、通过联结主义时间分类器CTC输出序列特征标签的概率分布,得到初步的识别结果;S6)、采用贪婪搜索和基于字典规则搜索得到文本最终的识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五邑大学,未经五邑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810239934.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top