[发明专利]一种文档扫描图像透字效应消除方法有效

专利信息
申请号: 201410301425.6 申请日: 2014-06-27
公开(公告)号: CN104036469B 公开(公告)日: 2017-02-15
发明(设计)人: 王建;刘长波 申请(专利权)人: 天津大学
主分类号: G06T5/00 分类号: G06T5/00
代理公司: 天津市北洋有限责任专利代理事务所12201 代理人: 程毓英
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文档 扫描 图像 效应 消除 方法
【说明书】:

所属技术领域

发明涉及扫描文档图像恢复技术,尤其是针对双面文档扫描图像的透字效应消除方法。

背景技术

当扫描双面打印或手写的文档时,一种常见的问题是从正面能看到背面的文字。这种现象称为“透字效应”。造成透字效应的原因是背面文本吸收了部分反射光线。扫描纸张越薄,或者反面文本的墨水渗透情况越严重,透字效应越明显。人们在构建数字图书馆时,经常需要将时间久远的文献或者手稿经扫描转化为数字图像。由于纸张以及墨水的渗透情况,扫描后的文档图像中透字效应很明显,这会严重影响扫描文档图像的可视质量。因此开展对扫描文档图像透字效应消除方面的研究是非常有必要的。

早期文献利用二值化处理消除扫描文档中的透字现象[1],但处理后的图像是以二值形式出现的,这种方法并不利于读者阅读原始文献资料的需求。还有一些方法同时使用扫描文档的正面和反面两幅图像来消除透字效应[2][3][4]。所用技术包括线性成像模型[2]、盲信号分离(BSS)[3]、独立成分分析(ICA)[4]、非负矩阵分解(NMF)[5]等。如果正反面两扫描图像严格对齐,使用这类方法可以得到很好的消除效果。但在实际情况下,文档对齐难以实现。特别是对于扫描文档较厚,或者纸张本身存在明显变形或者干扰的情况(如存放时间较长的旧文献)。另外当获取的扫描文档图像只有单面时,这种方法完全失效。还有一类基于单幅扫描图像的透字效应去除方法。如Lins等[6]首先将图像分为9个子块,并使用训练好的神经网络分类器将各个子块分为三类,分别对应于较弱、一般和较强三种透字效应干扰情况。对于不同情况的子块,分别选取对应的阈值分离正面文本区域,然后采用双线性插值技术去除背面文本的干扰。此类方法适用于扫描图像的透字效应去除,不适用于扫描文档的透字效应去除,而且,存在处理方法较为复杂的缺陷。

参考文献:

[1]J.da Silva,R.Lins,F.Martins,etal.“A new and efficient algorithm to binarize document images removing back-to-front interference,”Journal of Universal computer science,vol.14,no.2,pp.299-313,2008.

[2]A.G.Sharma,“Show-through cancellation in scans of duplex printed documents,”IEEE Transactions on Image Processing,vol.10,no.5,pp.736-754,2001.

[3]A.Tonazzini,E.Salerno,and L.Bedini,“Fast correction of bleed-through distortion in grayscale documents by a blind source separation technique,”International Journal on Document Analysis and Recognition,vol.10,no.1,pp.17-25,2007.

[4]A.Tonazzini,L.Bedini,and E.Salerno,“Independent component analysis for document restoration,International Journal on Document Analysis and Recognition,”2004,vol.7,no.1,pp.17-27.

[5]F.Merrikh-Bayat,M.Babaie-Zadeh,and C.Jutten,“Using Non-Negative Matrix Factorization for Removing Show-Through,”International Conference on LVA/ICA,2010.pp.482–489.

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410301425.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top