[发明专利]一种实用的二值文档图像倾斜角度检测方法无效
申请号: | 200910255753.6 | 申请日: | 2009-12-28 |
公开(公告)号: | CN101751571A | 公开(公告)日: | 2010-06-23 |
发明(设计)人: | 马磊;李文成;刘江;裴小根 | 申请(专利权)人: | 山东大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 王绪银 |
地址: | 250100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实用 文档 图像 倾斜 角度 检测 方法 | ||
技术领域
本发明涉及一种实用的二值文档图像倾斜角度检测方法,属于图像预处理技术领域。
背景技术
在文档图像的获取过程中,扫描图象或多或少会出现某种程度的倾斜,这种图象的倾 斜不仅会给下一步字符的切割造成困难,也影响最终的字符识别精度。因此,图像倾斜检 测与校正就显得十分重要,成为图像预处理的重要环节。
对于文档图像倾角检测,虽然文档图像中很少有真正的直线,但在图像中,文字行间 有很强的方向性,因此可以通过检测出图像中文本行的走向,从而得到倾斜角度。目前,文 档图像倾斜角度检测的主要方法有:Hough变换法、最小二乘法、数学形态学方法等。这 些方法均存在一个共同的问题,即难以同时兼顾检测方法的精确度和速度。其中,Hough 变换是最常用的倾斜角度检测方法,其优点是对图像中的噪声不敏感。其缺点是计算量 大,较大的检测范围和较高的检测精度将会急剧地增加时间与内存的消耗,这对于批量文 档图像倾斜角度检测的实用化无疑是非常不利的。
发明内容
针对现有技术的不足,本发明提供一种实用的二值文档图像倾斜角度检测方法。
一种实用的二值文档图像倾斜角度检测方法,检测方法如下:
1)在文档图像中遇到前景像素时,将前景像素所在行及其上下各一行像素以前景像 素为中心,向左右两侧扩展L个像素,设置像素值为1,L值为7-10;
2)对扩展后的图像进行长度滤波去除图像中孤立的凸出部分,获得有效的文本直线 特征;
3)采用基于模板的方法对图像进行平滑滤波,首先根据扩展后的图像的特征,选取 3X3模板,然后对图像中符合模板的模块进行填充、清除或连接,使最后得到的图像更加 平滑;
4)细化:对图像进行遍历,当遇到像素值为1的像素时,将该像素的值设置为该像 素的下一行像素值减去该像素的上一行像素值之差;当差为-1时,将该像素的值设置为 0;
5)标记:按列遍历像素,遇到像素值为1的情况,则将该像素用mark进行标记, 然后从该像素开始按行扫描该像素8-邻域中的下一列,如果8-邻域下一列中某一个像素 不为0,则将该像素用mark进行标记,并根据行号的变化,继续扫描,直到8-邻域下一 列的像素全部为0,此时将mark加1,并返回按列继续扫描,直到遍历整个图像结束;
6)统计相连像素数及过滤、二值化:包含以下步骤:(1)根据mark值建立数组, 统计相连的像素数,并存入相应的数组元素中;(2)遍历图像,当遇到值不为0的情况 时,如果其对应的数组元素小于阈值,则将该像素置为0,否则置为1;阈值为2L+1或 4L+2;
7)Hough变换:对所得图像进行Hough变换,返回倾斜角度,完成整个倾斜角度检 测过程。
在实际应用中,文本通常以横排为主,图像倾斜的角度一般较小(十几度以内),针 对这种情况,以及Hough变换中难以同时兼顾精确度和速度的问题,本发明通过遍历图 像中的前景像素,并对其进行扩展,来加强文本行特征,然后进行滤波平滑,并通过细 化算法,提取边缘特征,进而通过对细化后的像素进行标记,并统计像素点数,然后对 连续像素点数小于阈值的边缘特征进行过滤并二值化。最后对处理所得的图像进行Hough 变换检测二值文档图像的倾斜角度。实验证明本发明具有很高的实用价值。
附图说明
图1是本发明的检测流程示意图。
图2是扩展文本行流程示意图。
图3是长度滤波流程示意图。
图4是平滑滤波的模板和流程示意图。
图5是细化流程示意图。
图6是标记流程示意图。
图7是统计及过滤流程示意图。
具体实施方式
实施例:
一种实用的二值文档图像倾斜角度检测方法,流程图如图1所示,检测方法如下:
1)在文档图像中遇到前景像素时,将前景像素所在行及其上下各一行像素以前景像 素为中心,向左右两侧扩展L个像素,设置像素值为1,L值为7-10;
2)对扩展后的图像进行长度滤波去除图像中孤立的凸出部分,获得有效的文本直线 特征;
3)采用基于模板的方法对图像进行平滑滤波,首先根据扩展后的图像的特征,选取 3X3模板,然后对图像中符合模板的模块进行填充、清除或连接,使最后得到的图像更加 平滑;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910255753.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序