[发明专利]一种基于网格特征智能匹配残缺汉字的识别方法有效
申请号: | 201410607290.6 | 申请日: | 2014-11-03 |
公开(公告)号: | CN104376300B | 公开(公告)日: | 2018-01-30 |
发明(设计)人: | 陈旭;李耘书;杨翰典;王越亚;白维珊 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/68 |
代理公司: | 成都金英专利代理事务所(普通合伙)51218 | 代理人: | 袁英 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网格 特征 智能 匹配 残缺 汉字 识别 方法 | ||
技术领域
本发明涉及一种基于网格特征智能匹配残缺汉字的识别方法。
如今,碎纸复原技术在司法物证复原、历史文献修复以及军事情报获取等重要领域都有着重大作用。在对隐私信息进行处理时,也要将碎纸复原技术考虑在内。
如图1和图2所示,现在的碎纸复原技术主要是使用一种拼接算法,将汉字按像素点以矩阵形式存储,根据纸片边距和汉字匹配程度进行碎纸还原。虽然此方法科学易实现,但是由机器进行识别匹配,行列拼接均有出错的情况,最终会导致无法对汉字进行识别的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于网格特征智能匹配残缺汉字的识别方法,解决碎纸复原技术虽然由机器进行识别匹配,但行列拼接均有出错的情况导致最终无法对残缺汉字进行识别的问题。
本发明的目的是通过以下技术方案来实现的:一种基于网格特征智能匹配残缺汉字的识别方法,包括以下步骤:
S1:将碎纸复原图转化成0-1矩阵;
S2:根据图像位置定位规则,用完整字大小(大小取决于图像中平均字大小)的子矩阵逐行逐列的循环方法来定位汉字的图像位置;
S3:将步骤S2中得到的残缺汉字进行网格分块分成子矩阵,提取特征;
S4:分别对残缺汉字网格分割后的每一网格子矩阵特征通过标准词库进行智能匹配识别。
步骤S1采用MATLAB软件对碎纸复原图进行转化。
步骤S2中所述的图像位置定位规则包括:
(1)如果在完整字大小的子矩阵中含有宽/长等于一个字大小的,则确定一个完整字,同时记录位置;
(2)如果完整字大小的子矩阵中含有宽/长大于一个字大小的,则确定为1个残缺字,同时记录位置,并且再分别从左右/上下两个反方向循环,再确定一个残缺字,同时记录位置;
(3)如果完整字大小的子矩阵中含有宽/长少于一个字大小的,确定为1个残缺字,同时记录位置。
所述的步骤S3包括以下子步骤:
S31:按照残缺汉字大小,将残缺汉字分成多个子矩阵;
S32:对每个子矩阵分别用小波函数分析提取这多个子矩阵图片的多个参数矩阵,将这多个参数矩阵一起作为该残缺字的特征。
一种基于网格特征智能匹配残缺汉字的识别方法还包括一个建立标准词库子步骤:将每一个完整汉字的每种字号,分别进行网格分解,得到标准特征的多个子矩形及其多个参数矩阵,确定一个完整汉字的特征值。
所述的子矩阵为2*2大小的子矩阵。
所述的参数矩阵包括垂直属性、水平属性和对角属性的3个参数矩阵。
所述的多种字号为10号字至22号字之间的8种字号。
所述的步骤S4包括以下子步骤:
S41:将步骤S3得到的多个网格子矩阵与标准词库中每一个完整汉字的标准特征矩阵进行比较;
S42:如果相似度大于某一比例,就判定该残缺字为词库中的这个完整的字。
步骤S42所述的某一比例为百分之五十。
本发明的有益效果是:本发明首先将碎纸复原图转化成0-1矩阵,再根据图像位置定位规则,用完整字大小的子矩阵逐行逐列的循环方法来定位汉字的图像位置,判断其是否可能是一个残缺的字,有可能是字的话将其保存,然后通过基于小波函数提取汉字特征向量来实现与词库中的汉字识别。本发明解决碎纸复原技术虽然由机器进行识别匹配,但行列拼接均有出错的情况导致最终无法对残缺汉字进行识别的问题,提供一种残缺汉字识别方法。
附图说明
图1为商务函电样本图;
图2为样本碎纸复原效果图;
图3为本发明方法流程图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案:如图3所示,一种基于网格特征智能匹配残缺汉字的识别方法,包括以下步骤:
S1:将碎纸复原图转化成0-1矩阵;
S2:用完整字大小(大小取决于图像中平均字大小)的子矩阵逐行逐列的循环方法来定位汉字的图像位置;
S3:将步骤S2中得到的残缺汉字进行网格分块分成子矩阵,提取特征;
S4:分别对残缺汉字网格分割后的每一网格子矩阵特征通过标准词库进行智能匹配识别。
步骤S1采用MATLAB软件对碎纸复原图进行转化。
步骤S2中所述的定位汉字的图象位置的规则包括以下子步骤:
S21:如果在完整字大小的子矩阵中含有宽/长等于一个字大小的,则确定一个完整字,同时记录位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410607290.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于新能源汽车电池组PACK系统的急速降温装置
- 下一篇:一种电池揉片机