[发明专利]利用曲线匹配和信息对齐的粉碎文件重构方法在审
申请号: | 201510023241.2 | 申请日: | 2015-01-16 |
公开(公告)号: | CN104537629A | 公开(公告)日: | 2015-04-22 |
发明(设计)人: | 孔祥维;尚士泽 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/00 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 关慧贞 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 曲线 匹配 信息 对齐 粉碎 文件 方法 | ||
技术领域
本发明属于信息安全领域、信号与信息处理技术,涉及到粉碎文件重构中利用曲线匹配和信息对齐进行文件碎片重构方法。
背景技术
为防止重要信息外泄,通常采用的方法是使用碎纸机将文件粉碎,因此司法取证部门常常需要恢复毁坏的文件用于案件分析。2011年,美国国防部组织一项名为“DARPA碎纸机挑战”的竞赛用于鼓励粉碎文件重构问题的研究,并为第一名提供5万美元的奖励。此项竞赛共包括五个题目,其难度不断增加,由200片至6000片彩色扫描文件碎片构成,这五个题目也成为测试文件重构算法性能的标准测试集之一。
针对文件或图像重构类的问题已有较多公开发表的算法,但对碎纸机粉碎的文件重构问题的解决仍然十分困难。首先是文件碎片的尺寸和形状,碎片尺寸一般在3mm×6mm左右,碎纸机使用者希望碎片尺寸足够小来避免信息泄露的可能。另外,由于碎纸机的机械结构比较固定,文件碎片的形状十分相近,这对于使用形状特征重构文件的难度大大增加;其次,纸张在粉碎过程中产生形变也增加了重构的难度,形变主要存在于碎片的边缘。由于粉碎之后还需扫描成数字图像,存在的碎片丢失,颜色变化以及碎片重叠等问题均增加了文件重构的难度;第三,在文件恢复过程中还需要考虑文件碎片的数量,数量越大恢复的难度越大。尽管在数字文件恢复过程中有较多自动复原的算法(如硬盘数据的文件恢复),这些算法应用在文件碎片重构中不但耗费大量时间而且运算结果不稳定,很难得到正确的文件图像,因此在碎片拼接过程中需要更多的人工干预才能完成。总之,粉碎文件重构是一个十分复杂的过程,需要计算机的识别和人工筛选。
近年来也有许多学者提出了粉碎文件重构的算法。P.Butler等人在2012年的IEEE Symposium on Visual Analytics Science and Technology会议上发表的论文“The Deshredder:A Visual Analytic Approach to Reconstructing Shredded Documents”中使用由距离构成的Luma时间序列来描述碎片的形状,将碎片进行倾斜矫正之后,将Luma序列中的峰值点作为特征并利用Chamfer相似性度量的方法寻找相邻碎片;A.Deever等人在2012年的IEEE International Conference on Image Processing会议上发表的论文“Semi-automatic Assembly of Real Cross-cut Shredded Document”中对碎片轮廓点进行采样,并记录采样点的空间位置用于描述碎片形状,利用匹配代价函数来描述两个形状之间的相似性。上述方法中,在碎片拼接时需要较多人工干预或者碎片匹配效率都较低。
发明内容
本发明要解决的技术问题是针对现有技术的不足,发明一种利用曲线匹配和信息对齐的方法进行粉碎文件重构,利用碎片轮廓曲线的相似性寻找正确碎片对,并利用碎片上文本线、字符、颜色和图形信息的对齐排除错误匹配,完成文件碎片重构。本发明采用曲线匹配和信息对齐相结合的方法对文件碎片进行匹配,该方法对碎片旋转具有鲁棒性,同时可容忍一定的边缘重叠区域存在,提高了匹配效率。
本发明采用的技术方案是利用曲线匹配和信息对齐的粉碎文件重构方法,其特征是,重构方法利用曲线匹配和信息对齐进行文件碎片拼接,提取每个碎片的轮廓曲线信息,通过计算两曲线间的距离判断曲线间的相似性,进而寻找相邻碎片;判断碎片方向,减少不必要的匹配;在曲线匹配过程中,通过对碎片文本线、字符、颜色和图形信息的对齐来排除错误匹配;通过碎片对的选择得到正确的碎片对,并通过所选碎片对的匹配信息完成粉碎文件重构;具体步骤如下:
1)扫描粉碎文件及碎片图像预处理
首先,对粉碎文件进行扫描,得到粉碎文件的碎片图像;然后对碎片图像进行预处理,其过程包括碎片图像分割,碎片图像倾斜校正,碎片图像的文本线、颜色、字符和图形信息提取,碎片拐点信息提取,碎片轮廓曲线信息提取;
a)碎片图像分割
文件碎片是无序摆放,并扫描在同一幅图像中,需要将碎片图像逐一分割出来;碎片图像分割利用公开的边缘搜索方法,识别碎片轮廓曲线像素坐标后,逐一遍历直到对该轮廓曲线像素记录完成一个闭区间,即该碎片图像的轮廓曲线像素被完整地记录下来,最后将轮廓内碎片像素拷贝来完成碎片图像分割;
b)碎片图像倾斜校正
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学;,未经大连理工大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510023241.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置