[发明专利]一种碎纸机破碎英文文档的恢复方法有效

专利信息
申请号: 201310694779.7 申请日: 2013-12-17
公开(公告)号: CN103700081A 公开(公告)日: 2014-04-02
发明(设计)人: 沈亚雄;雷浩;杨捷 申请(专利权)人: 河海大学
主分类号: G06T5/50 分类号: G06T5/50;G06T7/00
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 柏尚春
地址: 210098 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 碎纸机 破碎 英文 文档 恢复 方法
【说明书】:

技术领域

发明涉及图像处理和信息恢复技术领域,具体涉及一种基于破碎纸片的边缘信息和破碎文字的几何特征的碎纸机破碎英文文档的恢复方法。

背景技术

碎纸机已经成为日常办公时重要的一部分,很多企业、科研机构和军队会出于保密的需要,使用碎纸机对重要文件、资料进行销毁,而在实际生活中,在许多情况下,需要将已经破碎的文档重新恢复。然而传统上,拼接复原工作需由人工完成,准确率较高,但效率很低,特别是当碎片数量巨大,人工拼接很难在短时间内完成任务,计算机具有快速处理海量数据的能力,而通过计算机算法对破碎英文文档进行恢复的研究还非常少,特别是恢复既被纵切又被横切的破碎纸片,因此,急需一种能够有效恢复破碎英文文档的方法。

发明内容

发明目的:本发明为解决现有技术中存在的不足,提供一种碎纸机破碎英文文档的恢复方法。

技术方案:一种碎纸机破碎英文文档的恢复方法,包括以下步骤:

(1)图像数字化:使用扫描仪对纸质英文文档碎片进行处理,并输出BMP格式的原始图像f(i,j),共有这样的图像p×q张,其中p指每一列碎纸片的张数,q指每一行碎纸片的张数;

(2)图像预处理:

步骤一、对BMP格式的图像文件进行预处理,提取图像的灰度,所有处理后的每张图像都是一个m×n的灰度矩阵,其中m指灰度矩阵的行数,n指灰度矩阵的列数;

步骤二、分别处理左右边界点;对于左边界点,若灰度值为255,则变为1;若灰度值为0,则不变;若灰度值为0~255之间的数,则根据次边界点的灰度值,将灰度值变为0或1,具体步骤为:将最左列第i行的灰度值Z1i与次左列同行的灰度值Z2i进行比较,若Z1i>Z2i,则Z1i=0,反之则Z1i=1;对于右边界点,若灰度值为255,则变为1;若灰度值为0,则不变;若灰度值为0~255之间的数,则根据次边界点的灰度值,将灰度值变为0或1,具体步骤为:将最右列第i行的灰度值Y1i与次右列同行的灰度值Y2i进行比较,若Y1i>Y2i,则Y1i=1,反之则Y1i=0;其中,Z1i是指m×n的灰度矩阵中最左列第i行的灰度值,Z2i是指m×n的灰度矩阵中次左列第i行的灰度值,Y1i是指m×n的灰度矩阵中最右列第i行的灰度值,Y2i是指m×n的灰度矩阵中次右列第i行的灰度值;

步骤三、处理中间点:通过设定灰度阈值将左右边界点之外的其他部分进行二值化处理,若一点的灰度值大于该阈值,则设定为1即为白点,反之设定为0即为黑点,所有处理后的每张图像都是一个m×n的二值化矩阵,其中m指二值化矩阵的行数,n指二值化矩阵的列数;

(3)碎片拼接:

1)、提取出处于同一行的破碎纸片,52个大、小英文字母中仅有7个字母会通过的四线三格纸的中、下格分界线,将四线三格纸中的第三条线作为每张碎纸片的定位线;定位线所处的行白点数目较少,而定位线的下一行则几乎全是白点;根据这一特征,将所有纸片的二值化矩阵按行求和,记为Adi,其中Adi表示第d张纸片第i行二值化矩阵在该行求和的值;任取一张纸片d1,找到其定位线所处的行h,则可以得到一个值B,B值反应了会在定位线处发生突变的情况,由于B值是其中一张纸片的二值化矩阵按行求和的值在定位线处的突变情况,有其特殊性;但又因为在同一次破碎文档的恢复中,破碎纸片的大小相同,设定的灰度阈值也相同,所以所有的破碎纸片在定位线处的二值化矩阵按行求和的值突变的情况也应类似。即若第d2张纸片第r+1行二值化矩阵在该行求和的值与第r行二值化矩阵在该行求和的值之比近似等于B,则第d2张纸片的定位线在r行,即;其中,W为常数,需要根据分行的效果确定,反应了纸片在定位线处二值化矩阵按行求和的值突变处于一个与B近似的范围之中,而不是一个特定的值;

根据这一方法,可以找出所有纸片的定位线所处的位置,定位线位置相同的碎纸片就处于同一行,进而可挑出处于同一行的破碎纸片;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310694779.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top