[发明专利]一种文档图像倾斜检测的方法和装置有效
申请号: | 201910043826.9 | 申请日: | 2019-01-17 |
公开(公告)号: | CN109784332B | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 刘永强 | 申请(专利权)人: | 京东数字科技控股有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;伊明明 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文档 图像 倾斜 检测 方法 装置 | ||
本发明公开了一种文档图像倾斜检测的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:提取文档图像的图像特征点;根据预设的旋转粒度和旋转范围,对所述图像特征点进行多次旋转操作,以及确定信号能量集合;所述信号能量集合中包括每次旋转操作的信号能量值;从所述信号能量集合中筛选出最大的信号能量值,确定所述最大的信号能量值对应的旋转操作的旋转角度,该旋转角度为文档图像倾斜角度。该方法是基于图像特征的信号能量检测倾斜角,支持多种文档版面,不限定文档为水平、垂直、或混合版面,支持多种图像特征,以及提高了检测精度高和计算速度。
技术领域
本发明涉及计算机技术领域,尤其涉及一种文档图像倾斜检测的方法和装置。
背景技术
倾斜文档图像,是指文献在电子化过程(扫描等)中,由于人为等外界因素影响从而照成扫描的文档与图像正边成一定角度,即倾斜现象,这种图像称之为倾斜文档图像。其中,文档图像倾斜检测是OCR(Optical Character Recognition图型识别)之图像预处理中至关重要的一步。当文档图像存在较严重的文字行倾斜时,如果不对其进行倾斜检测并进行倾斜矫正,那么检测到的文字行可能包含隶属于其它文字行的图像信息,这将导致最终OCR识别结果准确率下降。但是,倾斜检测一直还是非常具有挑战性的问题,尤其是包含图形,图表,数字或各种字体大小的文档图像倾斜检测。
目前,倾斜检测算法可以分为四类:投影法、霍夫变换法、近邻聚类法和行间互相关法。其都存在相应的问题,主要有:1、计算量大,运行时间过长。如:投影法、霍夫变换法其本质都是基于图像特征投影、计算方差等,该过程计算非常耗时。2、算法检测精度不高。如:近邻聚类法,因其基于特征联通域分析与合并,只有文本行接近水平的情况下,才有较好的检测结果。3、检测方法对不同的文档版面适应性差。如:行间互相关法,只有知道文档的具体版面是水平还是垂直,才能进行较准确的计算。对于混合版面,该方法更是难以处理。4、对图像特征提取质量要求过高。现有传统的检测方法都是基于图像特征进行检测的,当图像质量下降时,图像特征检测结果随之下降,最终影响倾斜检测结果准确性。
发明内容
有鉴于此,本发明实施例提供一种文档图像倾斜检测的方法和装置,能够是基于图像特征的信号能量检测倾斜角,支持多种文档版面,不限定文档为水平、垂直、或混合版面,支持多种图像特征,以及提高了检测精度高和计算速度。
为实现上述目的,根据本发明实施例的一个方面,提供了一种文档图像倾斜检测的方法。
本发明实施例的文档图像倾斜检测的方法包括:提取文档图像的图像特征点;根据预设的旋转粒度和旋转范围,对所述图像特征点进行多次旋转操作,以及确定信号能量集合;所述信号能量集合中包括每次旋转操作的信号能量值;从所述信号能量集合中筛选出最大的信号能量值,确定所述最大的信号能量值对应的旋转操作的旋转角度,该旋转角度为文档图像倾斜角度。其中,该旋转角度是指每次旋转操作相较于初始位置的旋转角度,
可选地,提取文档图像的图像特征点的步骤包括:对所述文档图像进行边缘检测处理、灰度处理或二值化处理;截取所述文档图像的感兴趣区域;根据所述边缘处理、灰度处理或二值化处理的结果,确定所述感兴趣区域的图像特征点为文档图像的图像特征点。
可选地,根据预设的旋转粒度和旋转范围,对所述图像特征点进行多次旋转操作,以及确定信号能量集合的步骤包括:基于创建的坐标系,确定每个图像特征点的坐标;根据预设的旋转粒度和旋转范围,对所述图像特征点进行多次旋转操作;对于每次旋转操作,记录每个图像特征点旋转操作后的坐标;根据每次旋转操作后的坐标,确定出每次旋转操作的信号能力值,以得到信号能量集合。
可选地,根据每次旋转操作后的坐标,确定出每次旋转操作的信号能力值的步骤包括:根据以下信号能量函数,确定每次旋转操作的信号能力值:
Energy_X=sum(HIST_X[i]*HIST_X[i]);
Energy_Y=sum(HIST_Y[i]*HIST_Y[i]);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910043826.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序