[发明专利]名片图像倾斜角度的测量方法和装置有效
申请号: | 200810246629.9 | 申请日: | 2008-12-31 |
公开(公告)号: | CN101770575A | 公开(公告)日: | 2010-07-07 |
发明(设计)人: | 李永彬;朱军民 | 申请(专利权)人: | 汉王科技股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 名片 图像 倾斜 角度 测量方法 装置 | ||
技术领域
本发明属于数字图像处理技术及OCR(光学字符识别)技术领域,特别涉及一种 名片图像倾斜角度的测量方法和装置。
背景技术
在当今的商务活动中,名片已经是商业合作伙伴、客户等的重要信息载体,面对 大量的名片,公司和个人都需要有一种方法进行自动、准确地信息采集和处理,目前一 般采用OCR(Optical Character Recognition)系统完成此功能。在名片OCR系统中, 输入的名片图像可能存在一定角度倾斜(一般小于5°),这种倾斜会对名片的版面分 析、字符切分及字符识别产生不良影响,需要进行倾斜角度检测,然后根据角度进行图 像校正。
现有的针对文档图像的倾斜检测方法,基本上都是基于二值图像的,主要可分为 4类:基于投影的方法、基于HOUGH变换的方法、K-最近邻簇方法和基于交叉相关性的 方法。
对于名片图像,其特点是文字行(列)较少,通常只有几行(列)或十几行(列), 文字个数较少,排版样式多变。K-最近邻簇方法需要较多的文字连通域才能计算出可靠 的结果,不适合名片图像;基于交叉相关性的方法的前提是文本具有一致的排版格式, 也不适合名片图像;基于HOUGH变换的方法计算量较大。所以上述四类用于文档图像倾 斜检测的方法中,基于投影的方法比较适合名片图像的倾斜检测。
申请号为200410080505.X的专利公开了一种图像处理方法,通过在图像中搜索直 线并根据直线的倾斜情况计算图像倾斜角度,在图像处理的过程中需要依赖于图像中的 直线。申请号为200710176208.9的专利针对复杂文档图像,通过文本区域及非文本区 域提取连通区域的边界段作为倾斜特征计算倾斜角度,需要图像中存在较多的连通区 域。这两种方法对于名片图像,这两种方法适用性较差,而且都是直接计算图像的倾斜 角度,而没有预先自动判断图像是否需要计算倾斜角度。对于不存在倾斜的图像而言, 倾斜角度为零,则不需要进行倾斜角度计算。
文献《灰度名片图像快速倾斜检测和校正方法》(《中文信息学报》2004年01期, 63-70页)提出一种根据扫描名片图像中名片的四条边框直线进行倾斜角度检测的方法, 该方法简单快速,但是对于名片图像不存在边缘直线的情况则无能为力,而且仅仅根据 边缘直线计算出的角度精度不是很高。
利用投影方法计算名片图像的倾斜角度,计算结果准确,但是对于不存在倾斜的 名片图像进行计算,是一种浪费;利用图像中名片边框直线计算倾斜角度的方法,简单 快速,但是对于边框直线缺失的情况,其失去作用,对于边框直线受噪声污染的情况, 其计算结果不够准确。
发明内容
本发明提出了一种名片图像倾斜角度的测量方法和装置,本方法首先提取名片图像 的边缘图像,然后在边缘图像中搜索名片的四周边框直线,根据边框直线的倾斜程度判 断图像是否存在倾斜,对于存在倾斜的图片,判断其文字的编辑方向,并沿着文字编辑 方向投影,利用投影特征计算图像的倾斜角度,既能自动区分名片图像倾斜与非倾斜, 又能计算出精确的倾斜角度。
名片图像倾斜角度的测量方法,包括如下步骤:
步骤1:输入并提取输入的名片图像的边缘。输入名片图像,提取灰度图像边缘作 为处理的基本内容。
步骤2:搜索名片图像四周的边框直线。自外向内在四个方向上对图像依次按行列 逐像素搜索,如果相邻行列记录到的第一个黑像素点的坐标在搜索方向上的位置差不大 于2个像素,则这两个黑像素点位于同一线段上,否则,新建线段。如果其中最长的线 段长度超过既定阈值,则该线段所在直线为此方向上的边框直线,否则,此方向上不存 在边框直线。
步骤3:根据搜索到的边框直线判断图像是否倾斜。如果边框直线数大于等于2, 并且标定为倾斜的边框直线数大于搜索到的边框直线数的0.7倍,则该图像倾斜;否则, 图像不存在倾斜,本方法结束。
步骤4:对标记倾斜的图像,判断图像中文字的编辑方向。分别在图像的竖直和水 平投影直方图内,以相同投影值区间和投影值间隔划定直线,分别计算直线穿过的既定 宽度的投影数目之和;将投影数目较大的方向作为文字的编辑方向。
步骤5:利用投影方法计算图像的倾斜角度。在图像的文字编辑方向上,在-5度到 +5度之间,按相等的角度间隔分别对图像进行投影,计算所得的每个投影直方图投影 值的平方和,图像的倾斜角度为投影平方和值最大的投影直方图的对应的投影角度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810246629.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序