[发明专利]一种基于外包络生长的图标检测方法及其应用无效
申请号: | 200810220383.8 | 申请日: | 2008-12-25 |
公开(公告)号: | CN101488183A | 公开(公告)日: | 2009-07-22 |
发明(设计)人: | 陈友斌;王宏业 | 申请(专利权)人: | 东莞市微模式软件有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 广州市华学知识产权代理有限公司 | 代理人: | 杨晓松 |
地址: | 523808广东省东莞市松*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 外包 生长 图标 检测 方法 及其 应用 | ||
技术领域
本发明涉及图像检测技术,特别涉及一种基于外包络生长的图标检测方法及其应用。
背景技术
在文本图像、网页图像的处理中,图标的检测是一种重要的辅助手段。通过检测并识别在文本中出现的图标,可以迅速确定文本的发行机构或网页的所属者,为对文本或网页内容的进一步分析提供重要的依据,从而极大地提高文本或网页的处理效率。
现有的图标检测处理技术有Automatic Document Logo Detection(文本图标的自动检测),来源:Proceedings of the Ninth InternationalConference on Document Analysis and Recognition(ICDAR 2007),这种方法的主要原理是:(1)如图1所示,将图像模糊化(即降低图像分辨率),这样由于在图标内部各部分距离相对较近,会粘连成一个整体。(2)对模糊图像,采取连通域方法对每一个粘连起来的整体进行提取,提取出来的每一个整体认为有可能是图标,送数据库鉴别。这种方法的主要缺点是:(1)图像模糊化后文本图像中的图标容易与文本图像中的其他成分相连,如图2、图3所示,在空间比较拥挤时,模糊化的结果不仅图标内部会粘连起来,图标与图标外部也会粘连起来。(2)连通域算法速度较慢。另一份文献Logo detection in documentimages(文本图像的图标检测),来源:Proc.Int’l Conf.Imaging Science,Sys.,and Tech.,pages 446—449,1997;这种方法的主要原理是:(1)使用文本分析的X-Y树方法将整幅文本图形进行分割。X-Y方法的过程是将整幅图像在横轴或者纵轴上做投影,以判断是否可以在横轴或纵轴上分割成两部分,如果可以,再将分割所得两部分各自重复该过程。(2)将X-Y方法所分割成的每一最小部分送数据库鉴别。这种方法存在的不足是:并非所有文本中的Logo都可以与其他成分X-Y可分,如图4所示,这张支票的手写字符与印刷体字符存在粘连,造成无法从横轴和纵轴的任一方向将支票内容分割。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种运算速度快,检测精确度高,适用性良好的基于外包络生长的图标检测方法。
本发明的另一目的在于提供上述基于外包络生长的图标检测方法的应用。
本发明的目的通过下述技术方案实现:一种基于外包络生长的图标检测方法,包括下述步骤:
(1)在整幅由像素组成图像中,将某些人为选定的可能属于一个图标的像素(例如,如果一幅图像是二值图像,则认为该二值图像的前景像素可能属于一个图标;如果一幅图像是彩色图像,则可认为某种颜色的像素可能属于一个图标;如果已知一幅文本图像的用途,则可预先确定图标可能的位置,这样只有在这些特定位置的像素才有可能属于一个图标)设为种子点,搜索图像中的像素,搜索到N(N≥1)个种子点后,在N个种子点的外侧设置特定形状的初始外包络;所述初始外包络包含该N个种子点在内,准备进行生长;
(2)对外包络的生长,设定基本终止条件:某一空间区域范围内覆盖的不同种类的像素(例如,在二值图像中的前景和背景像素、灰度图像中的不同灰度值的像素,彩色图像中不同颜色的像素等)分布情况满足预定要求;(3)从初始外包络出发,将初始外包络逐次生长为符合步骤(2)中终止条件的外包络;具体为:外包络的每次生长,先对外包络用步骤(2)的终止条件进行判断,如果还需要继续生长,则将外包络在特定方向上进行延伸,直至满足步骤(2)中的终止条件。
步骤(1)中,所述初始外包络的特定形状可为规则或不规则的几何形状,优选矩形、圆形。
步骤(1)中,搜索图像中的像素具体可为:对所有像素进行逐行逐列搜索,对于图标局限在特定空间区域内的图像,在一定范围内进行逐行逐列搜索。
步骤(2)中,所述预定要求可为:(2-1)在二值图像中,矩形外包络的边缘上不能存在前景像素;(2-2)圆形外包络离边缘距离一定范围内的前景像素和背景像素个数的比例在某阈值Nmax以下;(2-3)在灰度图像中,矩形(圆形、或其他形状)外包络边缘附近一定范围内的像素灰度值大于某值Gmax的像素个数在某阈值Nmax以下;(2-4)在彩色图像中,外包络边缘上不能存在某种颜色的像素等。
步骤(2)中,在满足该基本终止条件的基础上,也可以根据实际需要附加其他的特定条件,例如一定大小的外包络、不包含某像素的外包络、特定位置的外包络等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞市微模式软件有限公司,未经东莞市微模式软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810220383.8/2.html,转载请声明来源钻瓜专利网。