[发明专利]一种基于拆分匹配的汉字笔画自动提取方法在审

专利信息
申请号: 201410404614.6 申请日: 2014-08-15
公开(公告)号: CN104182748A 公开(公告)日: 2014-12-03
发明(设计)人: 董乐;梁燕;封宁;徐宗懿;张宁 申请(专利权)人: 电子科技大学
主分类号: G06K9/34 分类号: G06K9/34;G06K9/46
代理公司: 成都华典专利事务所(普通合伙) 51223 代理人: 徐丰
地址: 610041 四川省*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 拆分 匹配 汉字 笔画 自动 提取 方法
【说明书】:

技术领域

发明涉及一种基于拆分匹配的汉字笔画自动提取方法,用于汉字识别,属于模式识别与信息处理技术领域。

背景技术

由于汉字在我国的特殊重要性,汉字识别有着广阔的应用前景,如在文献检索,办公自动化,邮政书信分拣,试卷的自动阅读等方面有着重要的实际意义,对我国信息化发展有着不可替代的作用。同时,汉字识别也是科学理论研究的一个重要组成方面,它的研究也将促进各学科的研究与发展。随着汉字识别的应用越来越普遍,应用系统中对汉字识别的速度和正确率的要求也越来越高,一旦汉字笔画提取在正确率和速度上取得突破,汉字识别将随之取得突破。然而,由于汉字结构复杂,字符集庞大,不同字体的笔画在连接性,笔画长短、粗细方面各有不同,笔画与笔画之间、部件与部件之间的位置会发生变化,笔画的倾斜角会发生变化,这给笔画提取工作带来的大量的困难。

针对汉字笔画提取的重要性和困难性,研究者们提出了许多优秀的方案来解决。一种方法是通过细化提取汉字的骨架,再对骨架提取笔画。这种方法是应用最广泛的笔画提取方法,按细化后图形的连续性可以分为:四邻连接算法,八邻接算法和混合连接算法;按照处理方式来分有单方向、双方向和四方向细化法。细化方法时间复杂度低,但汉字点阵细化后会对笔画结构产生不良影响,可能会影响到交叉笔画畸变,转折处出现分叉笔画,失去短笔画及壁画合并等问题。

另一种方法提取笔画的对象主要针对灰度图、二值图和轮廓图。其情况分别如下:

1、从灰度图中提取笔画的方法,它将输入的灰度字符图像转换成一幅三维图像,再提取特征区域,然后建立了一个基于规则的系统;

2、从二值图中提取笔画的典型方法,充分利用了笔画的特征,但不足之处在与要对每个字符像素进行运算,时间耗费较高;

3、轮廓图分两级进行笔画提取,在第一级,通过轮廓字体的拓扑信息提取笔画段,达到去去相交和部分多余连接的部分,再对笔画段进行组合,通过构造字体进行粗分类,第二级,对不合格的笔画按照笔画段构造特征进行细提取,但该方法对笔画段的两两组合进行判断,耗时大。

高正确性和效率一直是汉字笔画提取的两个重要目标,然而现在的笔画提取技术很难同时在这两点上达到令人满意的效果。

发明内容

针对上述现有技术,本发明的目的在于如何提供一种基于拆分匹配的汉字笔画自动提取算法,旨在解决汉字笔画提取准确度不理想,提取速度慢的技术问题。

为了解决上述技术问题,本发明采用如下技术方案:

一种基于拆分匹配的汉字笔画自动提取方法,包括如下步骤:

步骤一:首先根据汉字结构,将汉字拆分为多个笔画部件;

步骤二:通过细化算法提取出步骤一得到的笔画部件的骨骼图,并通过计算每个字符像素的相交数找到骨骼图中的交叉点,再计算二值图像中该交叉点二维邻域中点PBOD曲线,将交叉点区域提取出来,其它的则为笔画段;

步骤三:对步骤一得到的笔画部件提取特征,并与标准库中的笔画部件的特征进行匹配;

步骤四:根据步骤三的匹配结果对笔画段进行组合,获得汉字的笔画;如果笔画部件匹配成功,则对步骤二所获得的交叉点和笔画段进行优化后,按照标准库中相匹配的笔画部件的笔画段组合方式直接进行组合并输出;如果匹配失败则根据笔画段组合规则对其进行笔画提取,并通过交互,将正确提取笔画的笔画部件及其交叉点和组合方式添加到标准库。

进一步地,对步骤一进行更详细地描述:根据汉字的二值图像中笔画是否连接或交叉把汉字拆分为数个笔画部件C=[s1,s2,…,sk],其中C表示汉字,k表示该汉字拆分成的笔画部件数目,si表示第i个笔画部件;将汉字图像规范化,判断每个值为1的像素点邻域是否都为1,如果不是则认为该点是边界点;相互连通的边界点标注出一个笔画部件。

进一步地,对步骤二进行更详细地描述:提取步骤一所获得的笔画部件的骨架图;对每个笔画部件所对应的骨架图计算每个像素的相交数Nc(p):

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学;,未经电子科技大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410404614.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top