[发明专利]基于文字特征的碎纸机破碎文档恢复方法有效

专利信息
申请号: 201210489146.8 申请日: 2012-11-26
公开(公告)号: CN103020929A 公开(公告)日: 2013-04-03
发明(设计)人: 邢楠;张婧;周一;李桥玮;朱虹;王栋 申请(专利权)人: 西安理工大学
主分类号: G06T5/50 分类号: G06T5/50;G06T5/40;G06T5/00;G06T3/40
代理公司: 西安弘理专利事务所 61214 代理人: 张瑞琪
地址: 710048*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 文字 特征 碎纸机 破碎 文档 恢复 方法
【权利要求书】:

1.一种基于文字特征的碎纸机破碎文档恢复方法,其特征在于,具体包括以下步骤:

步骤1、图像数字化:

使用扫描仪即可对纸质文档碎片进行处理,并输出BMP格式的原始图像f(x,y);

步骤2、图像预处理:

对原始图像f(x,y)依次进行直方图均衡化和图像滤波处理,再使用8邻域方向链码的方法从背景模板中提取得到全部碎片图像;

步骤3、图像拼接:

步骤3.1、对步骤2得到的碎片图像进行先腐蚀后膨胀的开运算,用以消除图像中的细小对象、分割目标物、平滑目标物且不明显改变其面积和形状;

步骤3.2、建立5×3的模板矩阵M:

111000000000111    ,

沿着开运算后的各个文档碎片的左右边缘向内进行搜索,向内搜索的范围是三个像素点,判断汉字的像素点是否能够满足矩阵M,若满足条件,认为该汉字结构是一个“横笔”,则将其直接延伸至图像最右边或最左边,否则,汉字结构保持不变;搜索整个碎片,并且准确记录碎片图像中各个汉字边缘处“横笔“的位置;

步骤3.3、对比两个文档碎片图像中左、右边列处的汉字“横笔”位置,若其中有“横笔”位置完全一致,则认为有一个汉字结构匹配上了,并且记录着两个碎片之间的总的笔画匹配数;以当前文档碎片图像为基准,与其他碎片图像继续重复上述比较过程,最终,以两个碎片之间的笔画匹配总数为依据,笔画匹配总数最大的两个文档碎片就是相邻的文档碎片,将该两个碎片图像进行拼接处理,且当出现多张碎片图像都与同一张碎片图像相匹配的情况时,根据最大相关性的原则,即匹配上“横笔”总数最多的碎片图像是相邻图像,这时才能将两张碎片图像拼接在一起;重复上述过程,最终得到的图像就是恢复的中文文档。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210489146.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top