[发明专利]用于二值化扫描文档图像的方法有效
申请号: | 201110359326.X | 申请日: | 2011-11-14 |
公开(公告)号: | CN102592126B | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 俞颂阳;明伟 | 申请(专利权)人: | 柯尼卡美能达美国研究所有限公司 |
主分类号: | G06K9/38 | 分类号: | G06K9/38;G06K9/46 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 朱胜,江河清 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 二值化 扫描 文档 图像 方法 | ||
技术领域
本公开涉及用于二值化扫描文档图像的方法和装置,并且具体地,涉及用于二值化包含用半色调模式打印的灰色或者浅色文字的扫描文档图像的方法和装置。
背景技术
随着计算机技术和因特网的发展,电子文档因为它相比基于纸的文档的优势而变得越来越流行,比如易于储存、易于查找和检索、快速传输、以及环境友好。在过去,基于纸的文档已经占主要地位很长时间并且在这些年来已经生成了大量基于纸的文档。可以使用扫描仪将基于纸的文档转换成电子文档。对于包含文字的文档,还期望能将扫描的文档图像转换成文字用以文字查找和其他目的。
已经开发出了自动文档分析系统以将扫描文档图像转换为可查找的电子文档。这样的系统通常包括三个主要的组件,也就是二值化组件、分割组件、和光学字符识别(OCR)组件。第一组件,二值化组件,将前景(文字、图片、线条画等)与背景分离。二值化组件将彩色或者灰度图像转换为其中每个像素具有0或者1的值的二值图像。二值化是重要的步骤,因为接下来的分割和识别组件依赖高质量的二值化图像。良好的二值化结果不仅可以减少计算负荷和简化接下来的分析,并且可以提高自动文档分析系统的整体性能。
在传统的方法中,一般全局地或者局部地执行二值化。全局二值化方法使用一个计算出来的阈值用于整个扫描图像来将多比特像素值转换成二值像素值。在该阈值以上的像素值被转换成1(或者0)而在该阈值以下的像素值被转换成0(或者1)。局部二值化方法使用从局部区域计算出的适合的统计值作为阈值用于局部区域的二值化。
全局二值化方法的例子可以在以下文献中找到:N.Otsu,“A Threshold Selection Method from Gray-Level Histograms”,IEEE Transactions on Systems,Man,and Cybernetics,Vol.9,No.1,1979,pp.62-66(在下文中称为“Otsu”);A.Rosenfield,R.C.Smith,“Thresholding using Relaxation”,IEEE Transactions on Pattern Analysis and Machine Intelligence,Vol.3,No.5,1981,pp.598-606;以及V.A.Shapiro,P.K.Veleva,V.S.Sgurev,“An Adaptive Method for Image Thresholding”,Proceedings of the 11th IAPR International Conference on Pattern Recognition,1992,pp.696-699。局部二值化方法的例子可以在以下文献中找到:W.Niblack,“An introduction to Image Processing”,Prentice-Hall,Englewood Cliffs,1986,pp.115-116;J.Sauvola,M.Pietikainen,“Adaptive document image binarization”,Pattern Recognition,Vol.33,2000,pp.225-236(在下文中称为“Sauvola等人”);以及I.Kim,D.Jung,R.Park,Document image binarization based on topographic analysis using a water flow model,Pattern Recognition Vol.35,2002,pp.265–277。
发明内容
因此,本发明提供了充分避免由于相关技术的限制和缺陷所引起的一个或多个问题的二值化方法。
本发明的目的是根据包含半色调文字和非半色调文字二者的扫描灰度图像来产生高质量的二值图像。
本发明的其它特征和优势将在接下来的说明书中阐述并且通过说明书将部分地明白,或者可以通过本发明的实践学到。本发明的目的和优势将通过在书写的说明书和权利要求书以及附图中具体指出的结构来实现和获得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于柯尼卡美能达美国研究所有限公司,未经柯尼卡美能达美国研究所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110359326.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:租用物品管理系统
- 下一篇:输入/输出模块总线触点系统以及方法