[发明专利]一种基于全卷积网络的多方向文本检测方法有效

专利信息
申请号: 201510989079.X 申请日: 2015-12-22
公开(公告)号: CN105608456B 公开(公告)日: 2017-07-18
发明(设计)人: 白翔;章成全;张拯;姚聪 申请(专利权)人: 华中科技大学
主分类号: G06K9/32 分类号: G06K9/32
代理公司: 华中科技大学专利中心42201 代理人: 曹葆青
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 卷积 网络 多方 文本 检测 方法
【说明书】:

技术领域

发明属于计算机视觉技术领域,更具体地,涉及一种基于全卷积网络的多方向文本检测方法。

背景技术

人们在生产和生活的过程中,要处理大量的文本、报表和文字,利用计算机自动识别字符,是计算机视觉应用中的一个重要领域。在文本的处理中,有大量的文本信息是以图片的形式保存的,如何利用计算机自动的从这些图片中提取出这些文本信息,是目前计算机视觉领域的一个重要的研究方向。文本检测是提取图片中文本信息的关键步骤,检测效果将直接影响文本的识别精度,进而影响文本信息提取的可信度。文本检测技术是以计算机视觉、模式识别和图像处理为基础,要求能够将文本从复杂的自然场景下检测出来,为文本识别以及文本信息提取能取得更好的效果做好铺垫。

发明内容

本发明的目的在于提供一种基于全卷积网络的多方向文本检测方法,该方法文本检测过程简单易行,且检测准确率高。

为实现上述方法,本发明提供了一种基于全卷积网络的文本检测方法,包括下述步骤:

(1)获得待检测图像中的文字条显著区域:

(1.1)对训练图像集中的各文本图像,根据文本在文本图像中的位置,获取各文本图像中的文字条显著区域,得到文字条显著区域集;

具体地,对给定的训练图像集,用人工标注的方法将训练图像集中各文本图像上的文本区域用矩形框标记出来,获取训练图像集中的文字条显著区域集;

(1.2)利用文字条显著区域集训练文本块全卷积网络模型;

具体地,对标注好的训练图像集中的文字条显著区域集,以这些文字条显著区域为正样本训练全卷积网络,得到文本块全卷积网络模型;

(1.3)利用训练得到的文本块全卷积网络模型获取待检测图像的文字条显著区域;

具体地,利用训练好的文本块全卷积网络模型对待检测图像进行检测,得到一张概率图,概率图中的每个像素点的灰度值表示该像素点是否在文字条显著区域内的概率,概率图中灰度级比阈值TB高的像素点即为图像中文字条显著区域内的像素点,这些像素点连成的区域即为得到的待检测图像中的文字条显著区域,其中TB为判断概率图中某像素点是否在文字条显著区域内的像素点灰度级的阈值,比如可以取0.2,灰度级在阈值TB以上的像素点连成的区域为待检测图像的文字条显著区域,表示为其中表示获取的第i个文字条显著区域,BNum为文字条显著区域的个数,Bs表示获取的所有文字条显著区域的集合。

(2)获取待检测图像中的多方向候选文本条:

(2.1)在获取的待检测图像的文字条显著区域中提取其中的字符成分;

具体地,对步骤(1)中获取的待检测图像中的每个文字条显著区域提取其最大稳定极值区域作为候选的字符成分,并用所得的候选字符成分的面积比和宽高比对得到的候选字符成分进行筛选,排除掉不满足条件的字符成分,对某个文字条显著区域记从该区域提取的字符成分集合为其中,表示在某文本块中提取的第j个字符成分,表示文本块中提取的字符成分的个数;

(2.2)估计获取的待检测图像的文字条显著区域的方向;

具体地,根据步骤(2.1)中获取的每个文字条显著区域中提取的字符成分的位置信息,估算该文字条显著区域的方向,其估算的方法如下式所示:

其中,Φ(θ,h)表示当该估算的文字条显著区域的中心点位置纵坐标为h、区域方向为θ时在该估算区域内的文字成分的数量,得到的角度即为估算出的该文字条显著区域的方向;

(2.3)提取待检测图像的候选文本条;

(2.3.1)获取待检测图像的文本块的字符成分组;

具体地,对步骤(2.1)中提取的文本块的字符成分集按照规则进行分组,其中分组规则为:对两个字符成分A和B,如果满足下述条件,则被划分到同一组,需要满足的条件如下式所示:

其中,H(A)和H(B)分别表示字符成分A和B的高度,O(A,B)表示字符成分A和B的区域中心的方向,为步骤(2.2)中估算出的文本块的方向,这样,可以对文本块中提取的所有字符成分进行分组,最终得到该区域的所有的字符成分组的集合,记为:其中βk={cj},表示文本块中的字符成分经过分组后的第k个字符成分组,表示区域中提取的字符成分集合的第j个字符成分,表示区域中字符成分组的个数;

(2.3.2)获取待检测图像的文本块的文本条边界点集;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510989079.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top