[发明专利]一种用于版面分析中的连通区域提取方法及装置无效
申请号: | 200810067409.X | 申请日: | 2008-05-23 |
公开(公告)号: | CN101290656A | 公开(公告)日: | 2008-10-22 |
发明(设计)人: | 朱慧莹;邹月娴;吴天瑞;刘宏 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 深圳创友专利商标代理有限公司 | 代理人: | 郭晓芬 |
地址: | 518055广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 版面 分析 中的 连通 区域 提取 方法 装置 | ||
技术领域
本发明涉及一种用于版面分析中的连通区域提取方法,本发明还涉及一种用于版面分析中的连通区域提取装置。
背景技术
如图1所示,名片识别的流程一般依次包括输入名片扫描图像、预处理、版面分析、字符识别、后录入处理和输出。其中预处理包括将图像二值化和分离文字、图像;版面分析包括连通区域提取、连通区域合并、版面理解。其中,连通区域提取是版面分析中的一个非常重要的步骤。连通区域的提取就是从白色像素和黑色像素组成的二值化点阵图像中,根据像素之间的连通性将相互连通的黑色像素集合或者白色像素集合提取出来,这些被提取出来的像素集合就是连通区域。
像素之间的连通性是确定连通区域的一个重要的概念,其意义如下:假设目标像素p(x,y)的邻域N(p)中有k个像素,对于这k个像素中任意第i个像素,如果其像素值和目标像素的像素值相同,则称这两个像素之间是相互连通的,即它们属于同一连通区域。
根据像素之间连通性的不同,可以有不同的连通区域提取方法。在图像处理领域中,目前广泛应用的是四连通处理方法和八连通处理方法。如图2所示,四连通处理方法的基本原理如下:
对于目标像素p(x,y),定义其邻域N4(p)为:
N4(p)={(x-1,y),(x+1,y),(x,y-1),(x,y+1)},对于和目标像素p(x,y)具有相同像素值的任意像素q(i,j),若q(i,j)在邻域N4(p)中,则称像素p(x,y)和像素q(i,j)相互连通,即它们属于同一连通区域。
八连通处理方法的基本原理如下:
对于目标像素p(x,y),定义其邻域N8(p)为:
N8(p)=N4(p)+{(x-1,y-1),(x+1,y-1),(x-1,y+1),(x+1,y+1)}(其中,N4(p)={(x-1,y),(x+1,y),(x,y-1),(x,y+1)}),对于和目标像素p(x,y)具有相同像素值的任意像素q(i,j),若q(i,j)在邻域N8(p)中,则称像素p(x,y)和像素q(i,j)相互连通,即它们属于同一连通区域。
现有的四连通处理方法和八连通处理方法符合人类的认知逻辑,在大部分实践中也能取得不错的效果,因而得到了广泛的应用。然而,这两种处理方法缺少与具体应用相关联的特殊性。在名片识别应用中,这两种方法所提取的连通区域面积小,提取连通区域数目多,造成了后续连通区域合并计算复杂度高,并影响最终的版面分析效果。实验证明这两种方法在名片识别应用中不能获得较好的连通域提取结果。而且,当前名片识别技术主要应用于手机等嵌入式平台上,其系统硬件资源有限,算法计算复杂度高会导致系统处理速度慢,使人们难以忍受,从而降低系统的可用性。
本发明所要解决的技术问题就是为了克服以上的不足,提出了一种用于版面分析中的连通区域提取方法及装置,减少后续连通区域合并的复杂度。
发明内容
本发明所要解决的技术问题就是为了克服以上的不足,提出了一种用于版面分析中的连通区域提取方法及装置,减少后续连通区域合并的复杂度。
为解决上述技术问题,本发明的方法,包括如下步骤:第一步:对于目标像素p(x,y),定义其邻域N(p)为:
N(p)={(x-1,y),(x+1,y),(x,y-1),(x,y+1),(x-1,y-1),(x+1,y-1),(x-1,y+1),(x+1,y+1),(x-4,y),(x-3,y),(x-2,y),(x+2,y),(x+3,y),(x+4,y),(x,y+2),(x,y-2)}
第二步:对于和目标像素p(x,y)具有相同像素值的任意像素q(i,j),判断q(i,j)是否在邻域N(p)中,若是,则将像素p(x,y)和像素q(i,j)作为同一连通区域进行提取。
优选地,所述第一步和第二步之间还包括如下步骤:
(1)、从左至右、从上至下对名片的二值化点阵图像进行像素标记;
所述像素标记的方法为:如果目标像素p(x,y)为白色,则将目标像素标记为0;如果目标像素为黑色,则判断目标像素的已扫描邻域的标记是否都为0;如果不是都为0,则使目标像素跟随已扫描邻域中第一个扫描出的非0标记,如果是都为0,则给目标像素一个新的非0标记;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810067409.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:磁铁嵌入式马达
- 下一篇:氧化烯烃蜡倾点下降剂