[发明专利]从所扫描的彩色图像生成双色调图像无效

专利信息
申请号: 200780015519.5 申请日: 2007-04-13
公开(公告)号: CN101433075A 公开(公告)日: 2009-05-13
发明(设计)人: 李永权;G·A·海吉斯;M·C·阿萨卡 申请(专利权)人: 伊斯曼柯达公司
主分类号: H04N1/403 分类号: H04N1/403;G06K9/38
代理公司: 中国专利代理(香港)有限公司 代理人: 张雪梅;王忠忠
地址: 美国*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 扫描 彩色 图像 生成 色调
【说明书】:

技术领域

本发明总体上涉及图像阈值化(thresholding)以及前景图像与背景图像的分离,更具体来说,本发明涉及一种用于从具有大量背景彩色内容的文档中获得高质量双色调图像(bitonal image)的方法。

背景技术

在生产扫描环境中,由于二进制(黑和白)形式具有更高的存储和传输效率(特别对于文字图像尤其如此),因此常常用所述二进制形式来表示及存储所扫描的纸质文档的数字输出。二进制形式还非常适用于文本扫描以及光学字符识别(OCR)。

一般来说,使用扫描仪来扫描文档,以便从电荷耦合器件(CCD)传感器获得8比特每像素的数字灰度信号。于是把该8比特每像素的灰度数据转换成1比特每像素的二进制数据将需要某种类型的图像阈值化过程。由于图像阈值化是图像数据缩减处理,因此该处理常常导致所不期望的图像伪像(artifact)或者图像信息的一定损失或恶化。图像阈值化中的错误可能导致比如文档背景中的斑点噪声或者低对比度字符的丢失之类的问题。

已经做了许多尝试以改进图像阈值化以及获得质量更高的二进制图像。例如,共同转让的美国专利No.4,868,670(Morton等人)公开了跟踪图像中的背景值,其中的阈值是所跟踪的背景值、噪声值与反馈信号的和。每当边缘或其他过渡出现在所述图像中时,就按照预先定义的模式瞬时地改变所述反馈信号以便瞬时地修改所述阈值,从而使得过滤后的经过阈值化的输出像素值具有减少的噪声内容。但是背景跟踪可以预防很多困难,特别在感兴趣的对象处于相对较低的对比度时尤其如此。一种不同的方法是在美国专利No.4,468,704(Stoffel等人)中描述的自适应阈值化。其中,阈值化是通过使用图像偏移量电势而实现的,所述图像偏移量电势是在逐像素的基础上作为所述图像中的白峰值电势和黑谷值电势的函数而获得的。结合最近邻像素使用该偏移量电势,以便提供自适应的、逐像素改变的更新后的阈值。对于每一个图像像素生成所述峰值电势和谷值电势,这例如是通过把该像素的图像电势与预定的最小白峰值电势和最大黑谷值电势进行比较而实现的。不幸的是,这种技术在经过阈值化的图像中提取低对比度对象时也遇到困难。

被全文合并在此的共同转让的美国专利No.5,583,659(Lee等人)公开了对于自适应阈值化(比如在之前列出的Stoffel等人的‘704专利中概述的一般方案中在逐像素的基础上进行的所述自适应阈值化)的重要改进。在所描述的方法中,首先对于每一个所扫描的灰度像素计算局部化的强度梯度数据,并且使用所述强度梯度数据来确定该像素是否处在边缘过渡附近。随后执行后续的处理以便进一步把该像素分类为边缘或平场、对象或者背景的一部分。按照这种方式来增强所述经过处理的输出图像,以便提供改进的阈值化。重要的是,使用两个变量用户输入作为阈值来细调所述图像数据处理。当获得对应于这些变量的最佳可能值时,自适应阈值化提供可以被精确地转换成双色调数据的图像。

从复杂的彩色背景中提取出感兴趣的文字和图像可能是特别困难的,并且所提出的传统解决方案仅仅实现了有限的成功。例如:

美国专利No.6,023,526(Kondo等人)描述了利用从彩色图像到双色调图像的直接转换而从彩色背景中提取文字数据,其中所述转换是基于滤色或者阈值化方法,所述滤色或阈值化方法利用了关于文字颜色的先有知识。虽然这种类型的方法可能适于扫描许多类型的邮政文档以及在另一种颜色的平场背景之上具有可预测颜色的文字的其他类型的文档,但是这种方法很不适用于具有可变背景颜色内容的文档,并且对具有可变背景颜色内容的文档的反应较差。

美国专利No.6,748,111(Stolin等人)使用拼贴方法来帮助在局部区域上分离文档的背景颜色内容。该方法在3D颜色空间内应用图像分割和颜色聚类,并且严重依赖于事先已知的关于文档格式和文字域的空间位置的多个假设。比如在Stolin等人的‘111公开内容中所描述的方法在从复杂彩色背景中隔离出文字方面工作得不好。

美国专利No.6,704,449(Ratner)描述了一种用于获得对应于具有标准图形文件格式的文档的彩色图像数据的迭代方法。所述Ratner‘449方法使用来自每一条复合颜色通道的图像二进制化,并且随后应用OCR处理以便验证成功的文字提取。这种类型的方法做出关于背景内容的一些全局假设,所述全局假设对于所显示的图像(比如从web页面下载的图像)可能适用,但是对于可能具有复杂彩色背景的所扫描的支票和类似的纸质文档则效用有限。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊斯曼柯达公司,未经伊斯曼柯达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200780015519.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top