[发明专利]一种扫描文档图像的倾斜角自动检测方法在审
申请号: | 201410769531.7 | 申请日: | 2014-12-15 |
公开(公告)号: | CN104463126A | 公开(公告)日: | 2015-03-25 |
发明(设计)人: | 文志强;曾志高;朱文球 | 申请(专利权)人: | 湖南工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 赵晓慧 |
地址: | 412007 湖南省株*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 扫描 文档 图像 倾斜角 自动检测 方法 | ||
技术领域
本发明属于图像处理技术领域,具体涉及一种扫描文档图像的倾斜角自动检测方法。
背景技术
随着数字图像处理技术的快速发展,文字识别、图像识别、图像复原等处理已成为非常重要的技术手段,而他们的处理对象大多数是通过扫描文档得到的数字图像。但是纸质文档通过图像获取设备(如数码相机、扫描仪等)转化为数字文档图像过程中,由于人为因素或扫描仪误差的影响,通过扫描得到的图像通常都会有一定的倾斜度。这种倾斜对后期图像处理带来不同程度的困难,如影响版面分析与理解,使对文字区、图形区和图像区的分割产生误差;使字符分割发生困难;引起字符明显变形,使得文字识别率降低。因此,倾斜角自动检测是一项重要的文档图像预处理技术。
目前常用的检测文档倾斜角方法有:霍夫变换、投影法、平行四边形法、交叉相关法、k最近邻法等。用霍夫变换变换来发现直线的过程是将图像上的一个点映射为参数空间上的一条直线,然后统计参数空间上直线相交次数最多的点坐标,即为原图像上直线参数,是“一对多”的过程。 因此,存在计算量大的问题,且参数空间的量化间隔影响直线角度的检测精度。量化间隔越小,计算量越大,需要内存越多,不适用于批量处理。且不适合于文本中存在横、纵、斜等多种书写方向(比如报纸)。投影法利用投影图在不同方向的某些特性来提取角度,只适合于纯文本图像的倾斜角检测。平行四边形法利用在不同方向上具有不同的平行四边形数量的特性来提取角度,对噪声敏感,不适合于文档中存在图表和噪声的情形。交叉相关法利用平行线上的像素点建立相关矩阵,然后对相关矩阵在竖直方向上进行投影,并使投影图的全局最大值对应于所检测的倾角。该方法计算量非常大,且不适合文档中含噪声或图片情形。k最近邻法先找出所有连通区中心点的k个最近邻点,然后计算每对近邻点的矢量方向,并统计生成直方图,直方图的峰值就对应于整个页面的倾角。该方法计算量大、容易受到噪声和文本特性的干扰。因此,必须寻找一种能抵抗噪声干扰和适应各种图文混排的倾斜角自动检测方法,满足实际的需要。
发明内容
针对现有技术中存在的缺陷,本发明的目的是提出一种扫描文档图像的自动检测倾斜角方法。该方法通过对扫描文档图像的初始处理、区域分割及区域特征提取等手段,能在有噪声干扰的情况下,自动检测到扫描文档图像的倾斜度。
为了达到以上目的,本发明采用的技术方案是:一种扫描文档图像的倾斜角自动检测方法,包括以下步骤:
(1)通过扫描仪获取数字化扫描图像,对扫描图像进行二值化及截边处理。
(2)对二值图像进行迭代行程处理、区域边缘提取、判断文档书写方向及区域边缘图像的选择。
(3)对(2)获得的图像进行区域增长、直线拟合、直线特征提取及直线的有效性判断。
(4)分析各条直线特征,提取扫描文档的倾斜度。
为了使本发明获得更好的发明效果,步骤(1)中,采用二值化阈值为130。采用扫描行或列的方法,计算行或列的像素均值和方差,通过设定阈值来找出文档图像中具有图像或文字的前景区域。
为了使本发明获得更好的发明效果,步骤(2)中,迭代行程处理由水平行程处理和垂直行程处理两个步骤组成,通过循环迭代,使得经处理后的图像不再发生变化为止。
为了使本发明获得更好的发明效果,步骤(2)中,区域边缘提取采用水平提取和垂直提取相结合的策略,通过判断边缘累积量来区分文档中文字排版方向及选择恰当的区域边缘图像。
为了使本发明获得更好的发明效果,步骤(3)中,从边缘图像上端的像素开始进行区域增长,邻域大小为2*2。对获得足够大的区域进行最小二乘法的直线拟合,提取其特征:区域中心,长度,倾斜度及直线拟合度。直线拟合度的计算方法为区域中前景像素到直线的平均垂直距离。通过对直线拟合度的判断来去除无效直线。
为了使本发明获得更好的发明效果,步骤(4)中采用融合两种策略的倾斜度自动提取方法。一种是采用直方图方法。第二种是采用中值方法。当检测到的直线数量达到一定数量时,采用直方图方法,否则采用中值方法。
本发明的效果在于:采用本发明所述方法,通过对区域边缘提取、区域增长方法等,就可以自动计算出文档的倾斜度。同时,通过对文字排版方向的判断、对区域大小的判断、对拟合直线的有效性判断及融合特征的倾斜度提取等,可以抵御扫描文档图像的噪声干扰,适应图文混排及不同书写方向混合的情形。
附图说明
图1文档倾斜检测流程图;
图2水平行程处理示例;
图3 扫描文档图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工业大学,未经湖南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410769531.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种指纹识别方法及装置
- 下一篇:人群密度信息获取方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序