[发明专利]一种基于EMD的智能文档图像块检测方法有效
申请号: | 201510305089.7 | 申请日: | 2015-06-04 |
公开(公告)号: | CN104951755B | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 蔡念;肖盼;陈裕潮;刘根;杨志景;王晗 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/46 |
代理公司: | 广州嘉权专利商标事务所有限公司44205 | 代理人: | 胡辉 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 emd 智能 文档 图像 检测 方法 | ||
技术领域
本发明涉及文档图像检测处理技术,尤其涉及一种基于EMD的智能文档图像块检测方法,适用于退化文档图像的自适应阈值分割。
背景技术
技术词解释
EMD:经验模态分解,英文全称为Empirical Mode Decomposition。
对于从文档图像的背景中区分文字,即将文档图像的灰度级图像转换为二值图像,其有巨大的应用价值,而在众多应用中,其主要应用在光学字符识别、自动银行支票处理、签名验证等方面。目前,已提出了许多算法来实现从文档图像的背景中区分文字,但是由于成像环境限制,文档图像常常被复杂的背景、非均匀的强度、阴影等这类因素退化,因此,使得分离文档图像中的文字,变得非常困难。
而为了解决这些问题,已有许多二值化算法被提出,这些算法主要归为两类,其包括:1、全局阈值分割算法,如Tsai,Johannsan, Kapur等算法,然而,这些方法并不适用于包含各种背景图案或背景不均匀的源图像;2、局部阈值分割算法,如Niblack,Sauvla,B.Goto 等算法,虽然其可适用于包含各种背景图案或背景不均匀的源图像,但是,在数据计算处理时,针对每个像素都必须估计其阈值,因此,这些方法均需耗费过长的处理时间,计算过程复杂冗长。而对于所述的文档图像二值化,其通常是被广泛应用于便携式设备中,但便携式设备的存储空间和计算能力均有限,因此,上述那些计算复杂度高、耗时长的局部阈值分割算法均不能满足将文档图像二值化应用于便携式设备的要求。
发明内容
为了解决上述技术问题,本发明的目的是提供一种计算简单、速度快的基于经验模态分解的智能文档图像块检测方法。
本发明所采用的技术方案是:一种基于EMD的智能文档图像块检测方法,该方法包括:
A、对文档图像进行灰度变换处理,从而获得文档灰度图像;
B、计算所述文档灰度图像的均值与方差,以及计算所述文档灰度图像的水平投影直方图;
C、对计算得出的水平投影直方图进行EMD分解,从而得到多个本征模函数分量以及残差,将得到的最后一个本征模函数分量和残差进行求和后,将求和结果作为所述水平投影直方图的趋势线;
D、计算趋势线与水平投影直方图之间交点位置的横坐标,然后根据计算出的多个横坐标,从而计算相邻交点位置的横坐标之间的间隔宽度;
E、根据计算出的间隔宽度,从而进行图像子块的分割,然后对分割出的多个图像子块进行阈值处理后,计算每个图像子块的均值与方差;
F、根据文档灰度图像的均值和方差以及图像子块的均值和方差,从而判断该图像子块是否为背景,然后根据判断的结果进行相应的处理。
进一步,对于步骤B中所述计算所述文档灰度图像的水平投影直方图,其所采用的公式如下所示:
其中,H(y)表示文档灰度图像的水平投影直方图,f(x,y)表示为文档灰度图像的像素矩阵,M表示为文档灰度图像的像素矩阵的行数。
进一步,所述步骤C具体包括:
对计算得出的水平投影直方图进行EMD分解,分解后所得出的结果如下公式所示:
其中,H表示为文档灰度图像的水平投影直方图,ci表示为第i 个本征模函数分量,rN表示为残差;
将得到的最后一个本征模函数分量和残差进行求和后,将求和结果作为所述水平投影直方图的趋势线,所述求和所采用的公式如下所示:
T=rN+cN
其中,T表示为趋势线,cN为第N个本征模函数分量,rN为残差。
进一步,所述步骤D包括:
D1、计算趋势线与水平投影直方图之间交点位置的横坐标;
D2、设置一数组,将计算得出的所有横坐标依序存储于该数组中,并在该数组中插入初始位置和终点位置;
D3、根据该数组,从而计算相邻交点位置的横坐标之间的间隔宽度。
进一步,所述步骤E包括:
E1、将计算出的间隔宽度作为图像子块分割窗口的高度和宽度,然后,根据该图像子块分割窗口进行图像子块的分割,分割后所得到的图像子块的高度和宽度均为上述计算出的间隔宽度;
E2、对分割出的多个图像子块进行阈值处理后,计算每个图像子块的均值与方差。
进一步,所述步骤F具体为:
根据文档灰度图像的均值和方差以及图像子块的均值和方差,从而判断该图像子块是否为背景;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510305089.7/2.html,转载请声明来源钻瓜专利网。