[发明专利]利用曲线匹配和信息对齐的粉碎文件重构方法在审

专利信息
申请号: 201510023241.2 申请日: 2015-01-16
公开(公告)号: CN104537629A 公开(公告)日: 2015-04-22
发明(设计)人: 孔祥维;尚士泽 申请(专利权)人: 大连理工大学
主分类号: G06T5/00 分类号: G06T5/00;G06T7/00
代理公司: 大连理工大学专利中心 21200 代理人: 关慧贞
地址: 116024 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明利用曲线匹配和信息对齐的粉碎文件重构方法属于信息安全领域、信号与信息处理技术,涉及到粉碎文件重构中利用曲线匹配和信息对齐进行文件碎片重构方法。该方法利用曲线匹配和信息对齐进行文件碎片拼接,提取每个碎片的轮廓曲线信息,通过计算两曲线间的距离判断曲线间的相似性,进而寻找相邻碎片;判断碎片方向,减少不必要的匹配;在匹配过程中,通过对碎片文本线、字符、颜色和图形信息的对齐来排除错误匹配;通过碎片对的选择得到正确的碎片对,并通过所选碎片对的匹配信息完成粉碎文件重构。本发明对碎片旋转具有鲁棒性,可容忍一定的边缘重叠区域存在,提高了匹配效率;适用于信息安全领域,有效地帮助文件检验人员重构粉碎文件。
搜索关键词: 利用 曲线 匹配 信息 对齐 粉碎 文件 方法
【主权项】:
一种利用曲线匹配和信息对齐的粉碎文件重构方法,其特征是,重构方法利用曲线匹配和信息对齐进行文件碎片拼接,提取每个碎片的轮廓曲线信息,通过计算两曲线间的距离判断曲线间的相似性,进而寻找相邻碎片;判断碎片方向,减少不必要的匹配;在曲线匹配过程中,通过对碎片文本线、字符、颜色和图形信息的对齐来排除错误匹配;通过碎片对的选择得到正确的碎片对,并通过所选碎片对的匹配信息完成粉碎文件重构;具体步骤如下:1)扫描粉碎文件及碎片图像预处理首先,对粉碎文件进行扫描,得到粉碎文件的碎片图像;然后对碎片图像进行预处理,其过程包括碎片图像分割,碎片图像倾斜校正,碎片图像的文本线、颜色、字符和图形信息提取,碎片拐点信息提取,碎片轮廓曲线信息提取;a)碎片图像分割文件碎片是无序摆放,并扫描在同一幅图像中,需要将碎片图像逐一分割出来;碎片图像分割利用公开的边缘搜索方法,识别碎片轮廓曲线像素坐标后,逐一遍历直到对该轮廓曲线像素记录完成一个闭区间,即该碎片图像的轮廓曲线像素被完整地记录下来,最后将轮廓内碎片像素拷贝来完成碎片图像分割;b)碎片图像倾斜校正若碎片中的文本线有一定的倾斜角度,需要进行倾斜校正使文本线达到水平;倾斜校正采用投影法,将碎片图像进行顺时针和逆时针旋转若干角度,并将碎片图像中的文本线信息水平投影至和碎片图像等高的列向量中,列向量中的元素只记录该行有无直线信息,找到某一旋转角度,使得列向量中直线信息数量最小,则该角度为碎片图像的倾斜角度,按照上述方法将所有碎片进行倾斜校正;c)碎片图像信息提取由于碎片图像中文本线、字符和颜色区域有不同的灰度值,可使用不同阈值对将碎片图像二值化然后分别提取其信息;使用Smallest Univalue Segment Assimilating Nucleus算子提取碎片拐点,由于碎片形状接近于矩形,因此每个碎片可提取四个拐点;拐点将碎片轮廓分为四条边,两个长边用于曲线匹配,两条短边用于碎片方向检测;倾斜校正过程使得碎片图像的轮廓曲线像素坐标发生变化,再次利用边缘搜索算法提取碎片图像的轮廓曲线;2)碎片图像方向检测:利用角度符号矩阵检测碎片方向,计算碎片短边的两端点与短边上任意一点的角度符号并累计求和,通过阈值将碎片方向分为向上、向下和未知三类;定义点A,C为碎片一短边的两个拐点,点B为碎片短边上的顶点,定义∠ABC为向量BA逆时针旋转至BC的角度;通过角度判断确定碎片方向;∠ABC的角度符号通过式(1)判断:当∠ABC>180°时,SignAngle=1;当∠ABC=180°时,SignAngle=0;当∠ABC<180°时,SignAngle=‑1;其中:SignAngle=sgn|xAyA1xByB1xCyC1|---(1)]]>将点B遍历相应边上的所有像素并计算角度符号再累加求和,得角度符号累计和为:SumSignAngle=Σn(SignAngle)---(2)]]>其中,N为碎片短边包含的像素数;为减小碎片方向检测的错误率,本发明对碎片方向的检测结果做出规定:如果则碎片为正向,如果则碎片为反向,其余情况均判断为未知方向;3)曲线匹配方法假设两曲线的坐标长度为L,将曲线起点重合在一起定义为点O,OA和OB分别表示两曲线的向量方向;每条曲线的向量方向由曲线上所有点与起始点组成向量的平均值得到,曲线向量方向的夹角表示曲线夹角;点Cx和Dx分别是曲线向量OA和OB上与起点O距离为x的两点,点C′x和D′x点分别是两条曲线上与起点O距离为x的两点;在理想情况下两个曲线间的夹角为0°或180°,其中180°表示匹配的两碎片存在上下颠倒的位置关系;在实际情况下,倾斜校正后碎片间仍存在误差;将曲线旋转使两条曲线的曲线向量方向相同,并定义曲线上两点C′x和D′x之间的距离为弧线差的绝对值|CxDx‑C′xD′x|,两曲线间的距离D可表示为[0,L]内的所有x所在位置的曲线上两点距离的平均值:D=mean(Σx=0L|CxDx-Cx′Dx′|)---(3)]]>OA和OB之间的夹角为α,则弧线CxDx的长度为:CxDx=α·x     (4)同理,弧线C′xD′x的长度为:C′xD′=α′·x     (5)将式(4)和(5)带入(3)中,得到曲线距离为:D=mean(Σx=0Lx·|α-αx′|)---(6)]]>理想情况下正确碎片对之间的曲线距离D=0,但由于点O位置未知,曲线上的所有点均有可能为O,因此,两碎片间的曲线匹配将有多个结果,其中,正确结果应该使得曲线间距离最小,即D=min{Do1,Do2,Do3,···},其中Do1,Do2,Do3表示O点在不同位置情况下的曲线距离;在计算曲线匹配时应逐沿着一条曲线并逐一像素的移动另一曲线进行匹配,并计算曲线间距离;4)信息对齐a)文本线对齐:将碎片2沿着碎片1方向移动,每对齐一次文本线就计算一次曲线距离,直到完成所有文本线的对齐;假设两个碎片上的文本线个数分别为M和N,则曲线匹配须计算M+N‑1次,即得到M+N‑1个曲线距离;当碎片上文本线的宽度大于1个像素时,通过对齐文本线的中心位置来完成;b)字符和图形信息对齐:本发明使用矩形窗遍历方法对字符和图形信息对齐,粉碎文件时,一个字符可能被分割为两个或者多个区域,并存在于碎片边缘,利用这些信息可获得正确的匹配结果;由于文件粉碎时带来的碎片形变,使碎片边缘存在重叠区域,本发明使用以轮廓曲线像素为中心的矩形滑动窗在轮廓曲线上进行遍历搜索,矩形窗中心位置为碎片轮廓曲线上的像素,如果矩形中心两侧均存在字符信息,则认为这两个曲线在该处的字符信息是对齐的;图形信息对齐与字符信息对齐相同;c)颜色信息对齐:定义颜色信息重合率作为特征,假设两个曲线上包含颜色信息的像素个数分别为N1和N2,N表示两曲线颜色信息中重叠的像素个数,颜色信息重合率可定义为:R=min(NN1,NN2)---(7)]]>当颜色信息重合率大于一定阈值时,认为两碎片的颜色信息是对齐的;5)碎片对选择碎片对选择的策略是将任意碎片与其余碎片进行匹配,并返回所有可能匹配情况的曲线距离,将曲线距离按照升序排列,在所列出的碎片对中选择正确的匹配结果;6)粉碎图像重构图像重构是利用已选择的碎片对匹配信息,对整个粉碎文件进行拼接重构;在重构过程中应考虑碎片拼接顺序及拼接过程中对空间位置关系变化的调整;首先选择任意碎片图像作为重构基础,然后选择与该碎片正确匹配的碎片进行拼接,以此类推恢复粉碎文件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学;,未经大连理工大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510023241.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top