[发明专利]一种定位自然场景图像中文本的方法无效
申请号: | 201210127131.7 | 申请日: | 2012-04-26 |
公开(公告)号: | CN102663383A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 殷绪成;尹绪旺;郝红卫 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 皋吉甫 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 定位 自然 场景 图像 文本 方法 | ||
技术领域
本发明属于图像文本分析领域,具体涉及一种定位自然场景图像中文本的方法。
背景技术
以往的定位自然场景图像中文本的方法大致可以归为两类:基于文本块的和基于图像连通域的。基于文本块的方法使用滑动窗口在图像中搜索可能的文本块,然后使用机器学习的算法进行文本块判定。基于图像连通域的方法首先通过某些方法提取图像中的连通域,然后将连通域聚合成文本块,并通过进一步的检查或使用机器学习算法进行文本块的判定。
在非专利文献1中,通过聚合具有相似笔划宽度的像素点形成连通域,得到的连通域经过过滤后聚合成文本。非专利文献2是一种基于文本块的方法,使用了文本块的水平和垂直梯度变化率的方差特征。非专利文献3中提到一种基于连通域的方法。该方法使用最稳定极值区域作为连通域,连通域聚合成文本块后提取文本块的梯度特征,并使用级联的分类器对文本块进行判定。
在目前已有的方法中,文本的查全率和查全率较低,处理速度较慢。
非专利文献1:B.Epshtein,E.Ofek,and Y.Wexler.Detecting text in natural scenes with stroke width transform.Computer Vision and Pattern Recognition(CVPR),2010 IEEE Conference on,pages 2963-2970,June 2010
非专利文献2:X.Chen and A.Yuille.Detecting and reading text in natural scenes.In Computer Vision and Pattern Recognition,2004.CVPR 2004.Proceedings of the 2004 IEEE Computer Society Conference on,volume 2,pages II-366-II-373 Vol.2,june-2 july 2004
非专利文献3:A.Shahab,F.Shafait,and A.Dengel.ICDAR 2011 robust reading competition challenge 2:Reading text in scene images.In Document Analysis and Recognition(ICDAR),2011 International Conference on,pages 1491-1496,sept.2011
发明内容
针对现有技术存在查全率和查准率低,处理速度慢的缺点,本发明提出了一种定位自然场景图像中文本的方法。
本发明提出的定位自然场景图像中文本的方法包括:图像连通域提取步骤,提取最稳定极值区域作为图像连通域;文本块提取步骤,针对图像连通域建立无向图模型并使用并查集提取无向图的连通域作为文本块;文本块判别步骤,提取文本块特征并使用机器学习算法进行文本块分类。在文本块提取步骤,定义无向图模型的邻接关系时考虑了连通域的高、宽、中心点、颜色和笔划宽度特征。在文本块识别步骤,提取的文本块特征包括文本块内连通域的笔划宽度、颜色、饱和度(compactness)、极值区域稳定性和水平垂直两个方向梯度变化率的方差和笔划宽度的均值。文本块判别步骤使用了AdaBoost学习算法进行文本块分类。
根据本发明,能够快速准确地定位自然场景图像中的文本,得到的查全率和查准率高于目前报告的方法。
附图说明
图1是本发明中的定位自然场景图像中文本的方法的系统流程图;
图2是本发明中文本块提取流程图;
图3是本发明中文本块判别流程图;
图4是本发明中像素点的笔划宽度提取示意图;
图5是本发明中基于连通域的文本块提取算法示意图;
图6是本发明中文本块基于梯度变化率特征的提取示意图;
图7是本发明中连通域边缘像素点导数计算示意图。
具体实施方式
以下结合附图对本发明的具体实施方式作详细说明。
图1是依据本发明的的定位自然场景图像中文本的方法的系统流程图。
如图1所示,依据本发明的定位自然场景图像中文本的方法包括图像连通域提取步骤101、文本块提取步骤102和文本块判别步骤103。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210127131.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于高效率定焦聚光式太阳能热发电厂的装置和方法
- 下一篇:绕组型旋转电机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序