[发明专利]基于文字结构部件检测神经网络的文字检测方法及系统有效

专利信息
申请号: 201510968301.8 申请日: 2015-12-21
公开(公告)号: CN105608454B 公开(公告)日: 2019-08-09
发明(设计)人: 周异;吴敏辰;陈凯;苗丽;奚国坚;周曲;任逍航 申请(专利权)人: 上海交通大学;中国太平洋保险(集团)股份有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06N3/02
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 徐红银;郭国中
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 文字 结构 部件 检测 神经网络 方法 系统
【说明书】:

本发明公开一种基于文字结构部件检测神经网络的文字检测方法及系统,所述方法在深度卷积神经网络中构建文字结构部件检测层,所述文字结构部件检测层对文字结构部件进行检测,从而实现文字区域定位和分割。在文字结构部件检测层中,构建是多个文字结构检测器,对某一类文字结构使用单独的文字结构检测器进行检测,提高了文字结构检测的准确性和独特性。本发明以文字结构部件检测的深度学习网络对文字结构特征的强提取能力为出发点,针对中文字结构特征做了专项检测,因此具有更高的主动性和精确性。

技术领域

本发明涉及一种图像处理技术领域,具体地说,涉及的是一种在自然场景图像中基于文字结构部件检测的深度学习网络的文字检测方法及系统。

背景技术

文本是计算机视觉的许多应用中的一项重要特征。图像中的文本存有很多有用的信息,对视觉内容理解和获取至关重要。文本提取的主要目的是将文本图像转化为符号形式,从而利于修改、检索、利用及传输。文本定位是文本提取的一个重要步骤。

文本定位是对图像中文本位置的精确定位。基于极值连通域的文本定位方法首先将图像表示为一个个的连通域,然后从结构分析出发,通过合并方法将文本行标示,输出结果。

传统的合并方法在处理一些结构复杂的汉字时效果不甚理想。外语如最常见的英语单词字符之间一般水平排列。对于中文文字,情况更加复杂。

经检索,于慧敏和李天豪申请的公开号为104794504A、申请号为201510207913.5的发明专利申请,该发明公开了一种在自然场景图像中基于深度学习的文字检测方法。首先,通过图形图案文字样本合成训练深度卷积自编码网络,然后使用已标记的样本,通过稀疏字典进行分类。之后使用合成的样本集,建立深度卷积自编码网络,并使用分层训练、整体调优的方式学习特征模板;然后对已有的标记样本,使用深度网络学习得到的特征模板进行特征提取;最后把提取的特征上采样至原图大小,并以单个分块作为识别的单位,训练稀疏字典以及分类器。在完成训练步骤后,对待处理的图像进行多分辨率分解,并使用特征模板提取特征,再使用稀疏字典进行分类获取结果。该发明使用稀疏字典分类方法在复杂中文文字的检测上效果不佳,原因是此类文字出现概率小,字典中很难找到。

发明内容

本发明的目的在于针对目前图像文本定位上的定位不甚理想的情况,提出一种在自然场景图像中基于文字结构部件检测的深度学习网络的中文检测方法及系统,采用文字结构特征分类提取的方法,可以克服上述问题,提高识别效果。

为实现上述目的,本发明采用以下技术方案:

本发明在深度卷积神经网络中构建文字结构部件检测层,所述文字结构部件检测层对文字结构部件进行检测,从而实现文字区域定位和分割。

本发明抓住深度学习网络对图像特征超强的提取能力,针对中文字中多种文字结构部件,构建了文字部件检测层,通过对文字结构部件的准确检测,从而实现文字区域定位和分割,方法简单有效。这种方法针对文字结构部件构建了文字部件检测深度卷积神经网络,在文字检测方面具有更好的针对性,因此具有更高的主动性和精确性。

具体的:

本发明提供一种基于文字结构部件检测神经网络的文字检测方法,包括以下步骤:

S1,在深度卷积神经网络构建文字结构部件检测层,所述文字结构部件检测层由多个文字结构部件检测器组成,针对中文字包含的文字结构部件的种类,对每一种文字结构部件构建相应的文字结构部件检测器;

S2,建立中文字数据集,包括从文字检测数据集中选出大量文字区域和非文字区域,用于训练深度学习网络;

所述S1、S2没有先后顺序要求,S1、S2完成后进行训练得到训练后的深度卷积神经网络;

S3,使用多尺度滑动窗算法提取自然图像中的候选文字区域,并由训练得到的深度卷积神经网络分类,得到文字区域;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;中国太平洋保险(集团)股份有限公司,未经上海交通大学;中国太平洋保险(集团)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510968301.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top