[发明专利]一种定位自然场景图像中文本的方法无效

专利信息
申请号: 201210127131.7 申请日: 2012-04-26
公开(公告)号: CN102663383A 公开(公告)日: 2012-09-12
发明(设计)人: 殷绪成;尹绪旺;郝红卫 申请(专利权)人: 北京科技大学
主分类号: G06K9/20 分类号: G06K9/20;G06K9/46
代理公司: 北京金智普华知识产权代理有限公司 11401 代理人: 皋吉甫
地址: 100083*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 定位 自然 场景 图像 文本 方法
【说明书】:

技术领域

本发明属于图像文本分析领域,具体涉及一种定位自然场景图像中文本的方法。

背景技术

以往的定位自然场景图像中文本的方法大致可以归为两类:基于文本块的和基于图像连通域的。基于文本块的方法使用滑动窗口在图像中搜索可能的文本块,然后使用机器学习的算法进行文本块判定。基于图像连通域的方法首先通过某些方法提取图像中的连通域,然后将连通域聚合成文本块,并通过进一步的检查或使用机器学习算法进行文本块的判定。

在非专利文献1中,通过聚合具有相似笔划宽度的像素点形成连通域,得到的连通域经过过滤后聚合成文本。非专利文献2是一种基于文本块的方法,使用了文本块的水平和垂直梯度变化率的方差特征。非专利文献3中提到一种基于连通域的方法。该方法使用最稳定极值区域作为连通域,连通域聚合成文本块后提取文本块的梯度特征,并使用级联的分类器对文本块进行判定。

在目前已有的方法中,文本的查全率和查全率较低,处理速度较慢。

非专利文献1:B.Epshtein,E.Ofek,and Y.Wexler.Detecting text in natural scenes with stroke width transform.Computer Vision and Pattern Recognition(CVPR),2010 IEEE Conference on,pages 2963-2970,June 2010

非专利文献2:X.Chen and A.Yuille.Detecting and reading text in natural scenes.In Computer Vision and Pattern  Recognition,2004.CVPR 2004.Proceedings of the 2004 IEEE Computer Society Conference on,volume 2,pages II-366-II-373 Vol.2,june-2 july 2004

非专利文献3:A.Shahab,F.Shafait,and A.Dengel.ICDAR 2011 robust reading competition challenge 2:Reading text in scene images.In Document Analysis and Recognition(ICDAR),2011 International Conference on,pages 1491-1496,sept.2011

发明内容

针对现有技术存在查全率和查准率低,处理速度慢的缺点,本发明提出了一种定位自然场景图像中文本的方法。

本发明提出的定位自然场景图像中文本的方法包括:图像连通域提取步骤,提取最稳定极值区域作为图像连通域;文本块提取步骤,针对图像连通域建立无向图模型并使用并查集提取无向图的连通域作为文本块;文本块判别步骤,提取文本块特征并使用机器学习算法进行文本块分类。在文本块提取步骤,定义无向图模型的邻接关系时考虑了连通域的高、宽、中心点、颜色和笔划宽度特征。在文本块识别步骤,提取的文本块特征包括文本块内连通域的笔划宽度、颜色、饱和度(compactness)、极值区域稳定性和水平垂直两个方向梯度变化率的方差和笔划宽度的均值。文本块判别步骤使用了AdaBoost学习算法进行文本块分类。

根据本发明,能够快速准确地定位自然场景图像中的文本,得到的查全率和查准率高于目前报告的方法。

附图说明

图1是本发明中的定位自然场景图像中文本的方法的系统流程图;

图2是本发明中文本块提取流程图;

图3是本发明中文本块判别流程图;

图4是本发明中像素点的笔划宽度提取示意图;

图5是本发明中基于连通域的文本块提取算法示意图;

图6是本发明中文本块基于梯度变化率特征的提取示意图;

图7是本发明中连通域边缘像素点导数计算示意图。

具体实施方式

以下结合附图对本发明的具体实施方式作详细说明。

图1是依据本发明的的定位自然场景图像中文本的方法的系统流程图。

如图1所示,依据本发明的定位自然场景图像中文本的方法包括图像连通域提取步骤101、文本块提取步骤102和文本块判别步骤103。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210127131.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top