[发明专利]确定区域结构复杂度、定位文字区域的方法及装置有效

申请号：	201210050872.X	申请日：	2012-02-29
公开（公告）号：	CN103295004B	公开（公告）日：	2016-11-23
发明（设计）人：	郑琪;王永攀	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G06K9/20	分类号：	G06K9/20
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	郭润湘
地址：	英属开曼群岛大开曼***	国省代码：	开曼群岛;KY
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	确定区域结构复杂度定位文字方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本申请涉及数字图像处理技术领域，尤其涉及一种确定区域结构复杂度、定位文字区域的方法及装置。

背景技术

随着数码相机的推广和互联网技术的发展，自然场景下拍摄的数字图像和人工编辑生成的数字图像越来越多，在诸如扫描文档内容识别、自动邮政编码识别等文字识别场景下，需要对上述数字图像中的文字进行识别，而绝大部分数字图像中除文字外存在较为复杂的背景图像，为了识别具有复杂背景的数字图像中的文字，需要首先对文字区域进行定位，也即区分数字图像中的文字区域和非文字区域。

因文字区域通常是结构化区域，有比较明显的几何形状(如：汉字中常常出现转折；拉丁字母中有较多的圆弧)，而非文字区域的结构或形状通常比较杂乱，没有规律，或比较简单(如：斑点、条纹)，故通常利用区域结构复杂度这一度量的值的大小来区分数字图像中的文字区域和非文字区域，区域结构复杂度越大，则数字图像为文字区域的可能性越大；区域结构复杂度越小，则数字图像为文字区域的可能性越小。所述区域结构复杂度是指：区域结构的转折、分叉、孔洞等几何上变化次数和程度的度量。

目前，确定区域结构复杂度的方法分为两类，第一类为间接确定区域结构复杂度；第二类为直接确定区域结构复杂度。其中：

第一类方法并不提取区域结构的转折、分叉或孔洞等特征，而是利用区域结构的其他特征，如：文字与外接椭圆(或外接矩形、外接凸多边形)的面积比、文字面积与周长比、区域压缩率(即文字面积和周长平方比)，来确定区域结构复杂度，这些特征能够区分相对简单的斑点、直线，但对于比较复杂的形状就无能为力了，因此使用这类方法确定区域结构复杂度，进而用来反映区域是文字区域的准确性较差，只能用在确定文字区域的粗过滤阶段，用来确定那些最不可能为文字区域的图片。

第二类方法中，常用的确定区域结构复杂度的方法有以下四种：

第一种方法：

确定数字图像的候选区域的连通分量，在连通分量上提取Harris角点，统计Harris角点的个数，将统计得到的Harris角点的个数作为候选区域的区域结构复杂度。

所述连通分量是指：在数字图像处理中，对于一个点集，如果其中的任何两个点之间，都存在一条由点集内的点序列组成的路径连接，那么这个点集构成了连通分量。序列中相邻的两点必须为邻接关系。如图1所示，每个小方格表示一个像素点，白色为背景区域，区域和区域是两个8邻接的连通分量。

确定连通分量的方法较多，常用的是：先利用Niblack算法对图像进行分割(根据图像的颜色或灰度信息将图像分为不同的层的过程)，再采用基于区域增长的算法对分割后的图像进行连通分量分析，即可得到连通分量。

在上述第一种方法中，确定出的Harris角点往往不是真正的笔画转折点，如在图2所示的连通分量中提取出的Harris角点(图2中以黑色实点表示)均不是笔画转折点，因此，利用所述第一种方法来确定区域结构复杂度的准确性不高。

第二种方法：

确定数字图像的候选区域的连通分量，对连通分量进行骨骼化，统计骨骼上分叉点得个数，将统计得到的分叉点的个数作为候选区域的区域结构复杂度。

在上述第二种方法中，对连通分量进行骨骼化时，利用的骨骼化算法容易受到强噪声的干扰，噪声区域往往会被作为新的分叉点。例如，在图3所示的对连通分量(图3中较细的黑色实线表示)进行骨骼化后的图形(图3中较粗的黑色实线即为连通分量的骨骼)，因噪声的作用，骨骼中出现了本来没有的分叉点(图3中以黑色实点表示)。这就错误的增加了区域结构的复杂度，因此所述第二种方法来确定区域结构复杂度的准确性不高。

第三种方法：

确定数字图像的候选区域的连通分量，寻找连通分量内部孔洞，统计孔洞的个数，将统计得到的孔洞的个数作为候选区域的区域结构复杂度。

上述第三种方法，一定程度上能反映候选区域的区域结构复杂度，但对于不含孔洞或孔洞数量极少的候选区域，尽管该候选区域实际上是文字区域，但用确定的区域结构复杂度判定时，判定的结果会为非文字区域，因此，所述第三种方法来确定区域结构复杂度的准确性不高。

第四种方法：

第一步，确定数字图像的候选区域的连通分量。

第二步，对确定的连通分量进行轮廓提取。

第三步，对提取的轮廓进行多边形逼近，得到反映所述轮廓的多边形。

所述多边形逼近是指：对于一个不规则的图形轮廓，采用一个多边形来逼近这个轮廓，以减少顶点的数目。

常见的多边形逼近的方法有以下两种：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司，未经阿里巴巴集团控股有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】