[发明专利]基于文字特征的碎纸机破碎文档恢复方法有效
申请号: | 201210489146.8 | 申请日: | 2012-11-26 |
公开(公告)号: | CN103020929A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 邢楠;张婧;周一;李桥玮;朱虹;王栋 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06T5/50 | 分类号: | G06T5/50;G06T5/40;G06T5/00;G06T3/40 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 张瑞琪 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文字 特征 碎纸机 破碎 文档 恢复 方法 | ||
1.一种基于文字特征的碎纸机破碎文档恢复方法,其特征在于,具体包括以下步骤:
步骤1、图像数字化:
使用扫描仪即可对纸质文档碎片进行处理,并输出BMP格式的原始图像f(x,y);
步骤2、图像预处理:
对原始图像f(x,y)依次进行直方图均衡化和图像滤波处理,再使用8邻域方向链码的方法从背景模板中提取得到全部碎片图像;
步骤3、图像拼接:
步骤3.1、对步骤2得到的碎片图像进行先腐蚀后膨胀的开运算,用以消除图像中的细小对象、分割目标物、平滑目标物且不明显改变其面积和形状;
步骤3.2、建立5×3的模板矩阵M:
沿着开运算后的各个文档碎片的左右边缘向内进行搜索,向内搜索的范围是三个像素点,判断汉字的像素点是否能够满足矩阵M,若满足条件,认为该汉字结构是一个“横笔”,则将其直接延伸至图像最右边或最左边,否则,汉字结构保持不变;搜索整个碎片,并且准确记录碎片图像中各个汉字边缘处“横笔“的位置;
步骤3.3、对比两个文档碎片图像中左、右边列处的汉字“横笔”位置,若其中有“横笔”位置完全一致,则认为有一个汉字结构匹配上了,并且记录着两个碎片之间的总的笔画匹配数;以当前文档碎片图像为基准,与其他碎片图像继续重复上述比较过程,最终,以两个碎片之间的笔画匹配总数为依据,笔画匹配总数最大的两个文档碎片就是相邻的文档碎片,将该两个碎片图像进行拼接处理,且当出现多张碎片图像都与同一张碎片图像相匹配的情况时,根据最大相关性的原则,即匹配上“横笔”总数最多的碎片图像是相邻图像,这时才能将两张碎片图像拼接在一起;重复上述过程,最终得到的图像就是恢复的中文文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210489146.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于晶硅电池及组件车间的手动取液装置
- 下一篇:一种电池片单元