[发明专利]基于水平投影和K均值聚类的横纵切碎纸片重建方法有效
申请号: | 201710450717.X | 申请日: | 2017-06-15 |
公开(公告)号: | CN107180412B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 刘有军;陈军华;王文馨;齐兴明 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06T5/50;G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 水平 投影 均值 切碎 纸片 重建 方法 | ||
本发明公布了一种基于水平投影和种子点约束K均值聚类的横纵切碎纸片重建方法,把文件碎片的图像向水平方向投影,用投影的来的一维信号进行聚类分行。以每一行首个碎片转化而来的一维信号为种子点约束K均值聚类中的初始种子点,应用K均值算法分行聚类。应用引入惩罚系数的距离计算公式计算每行内碎片之间的距离,并建立碎片之间距离的邻接矩阵,从而把碎片的行内拼接问题转化为旅行商问题。应用蚁群算法求解由行内拼接问题转化而来的旅行商问题,引入合并和分治策略提高行内拼接精度。最后使用行碎片的特征向量匹配实现行碎片的拼接。
技术领域
本发明属于图像处理领域,涉及的是一种基于横纵切碎纸片图像的文字信息复原拼接方法,是水平投影、种子点受限的K均值聚类以及蚁群方法在碎纸片拼接中的应用。
技术背景
文件检验是法医学的一个重要子领域,其与刑事、军事、民事、政府执法、司法等领域有重大的联系。文件检验的关键是利用一系列已知的标准并应用科学的方法对可疑文件进行检验对比,例如签名验证、笔迹鉴定等。为了得到可靠的结果,法医工作者必须依靠保存完整的文件。
很多时候可疑文件会受到不同程度的毁坏,文件可能被撕去边角,虫蛀,浸湿,以及撕碎。在最后一种情况中,文件可能被人手或者机器撕毁,无论哪种情况,法医工作者们都需要修复文件才能完成下面的鉴定工作。通过碎片的大小和数量以人工的方式来修复粉碎的文件需要大量的时间,修复几份文件可能需要几天甚至几周的时间。而且文件修复拼接是一件非常无聊沉闷的工作,因此设计一个高效的自动文件修复方法显得非常的必要。
碎纸机作为保护用户纸质文件信息安全的工具,要求粉碎文件信息不可被复原。多数碎纸机把文件粉碎成横纵向小块状,因此研究横纵切碎纸片修复方法同时可以指导碎纸机的升级设计,更好地保护用户的信息安全。
发明内容
本发明旨在提出了一种重建横纵切碎纸片拼接方法,该方法较国内外已有的方法拥有更高的精度、更自动化。该方法较之于人工拼接技术,可大大提高工作效率。
具体技术内容如下:
1.1.对每一个碎片进行水平投影,把每一个碎片转化为一个一维信号;
1.2.根据碎片的一维信号,应用种子点受限的K均值聚类算法实现碎片的分行聚类;
1.3.对每一行进行排序,把碎片行内拼接问题转化为旅行商问题,应用蚁群方法求解这个旅行商问题;
1.4.使用行碎片的特征向量FC=[a1,a2,a3,a4]进行匹配实现行碎片的拼接。
2.所述的步骤1.1包括:
2.1.把每一个碎纸片的图像进行二值化处理,当像素点的灰度值大于阈值时二值化为1,灰度值小于阈值时二值化为0;
2.2.从左到右累加图像每一行中为黑色的像素点的个数,该过程的数学表达式如下所示:
其中f(y)表示图像在y行中黑色的像素点的个数;I(x,y)表示图像I在点 (x,y)处的灰度值,当该点是黑色时该点的灰度值为0,当该点是白色时该点的灰度值为1;N表示碎片图像的水平分辨率;
2.3.经过步骤2.2.,碎片图像i转化为一个有m维的一维向量di,其中m表示碎片图像的垂直分辨率。
3.所述的步骤1.2包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710450717.X/2.html,转载请声明来源钻瓜专利网。