[发明专利]一种面向矢量字形的汉字笔画自动提取方法有效

专利信息
申请号: 201510303067.7 申请日: 2015-06-04
公开(公告)号: CN104992143B 公开(公告)日: 2018-10-26
发明(设计)人: 孙浩;连宙辉;唐英敏;肖建国 申请(专利权)人: 北京大学
主分类号: G06K9/00 分类号: G06K9/00
代理公司: 北京君尚知识产权代理事务所(普通合伙) 11200 代理人: 冯艺东
地址: 100871 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 矢量 字形 汉字 笔画 自动 提取 方法
【说明书】:

发明涉及一种面向矢量字形的汉字笔画自动提取方法,其步骤包括:1)对待提取的目标字形以及模板数据库中与其相对应的带有笔画归类信息的模板字形进行骨架提取,得到数据点集和模板点集;2)将数据点集、模板点集以及模板点集的笔画归属关系作为输入,进行基于结构信息的非刚性点集注册,得到数据点集的笔画归属关系;3)将数据点集的笔画归属关系转换成数据轮廓段的归属关系,使构成字形轮廓的每一个轮廓段具有相应的归属笔画;4)连接生成的轮廓段,得到最终的矢量笔画提取结果。本发明的矢量化方法能够精确地实现字形的笔画提取,且完全不需要人工的干预,算法可以自动运行,有利于矢量化笔画提取的批量运行。

技术领域

本发明涉及一种矢量字形的汉字笔画自动提取方法。更具体地说,涉及到一种非刚性点集注册方法,并使用点集注册的结果提出一种提取矢量汉字笔画的算法,从而完成对矢量字形的笔画自动提取,属于计算机图形学和图像处理技术领域。

背景技术

汉字是一种古老的文字,拥有着近五千年的悠久历史。在汉字的发展演化过程中出现了多种多样的字体,在计算机发展的早期,汉字字库仅包含黑体、宋体、楷体和仿宋等几种有限的字体。随着计算机技术的发展和网络的普及,人们对于不同字体的需求越发迫切。

目前制作一套字库主要有两种方法:一种是由人工完成整个字库集的书写,然后对字形进行扫描和处理,存储到字库中;另一种是由人工来设计出每个汉字的字形,存储到字库中。制作一款字库大约需要2-3人年,效率较低。所以自动化的字库生成方法成为当今汉字技术研究者的一个重要课题。

自动化生成字库基于汉字具有结构化的性质,即汉字字形由笔画和部件构成,相同的笔画和部件经过拼组可以形成不同的汉字。通过对一小部分汉字进行笔画提取,可以使用算法拼组生成整个汉字字库。可见笔画提取是自动化生成字库的一项关键技术。

目前现有的笔画提取方法都是基于图像的汉字笔画提取。而我们知道,字形存储的演化是从图像字形发展到图形字形,使用Bezier曲线来表示字形有着更高的精确度以及更灵活的存储及处理方式。如果将现有的研究成果优化整合到基于图形的字体,应能取得更加精确理想的实验结果。

发明内容

本发明的目的在于提出一种面向矢量字形的汉字笔画自动提取方法,可以有效地针对输入的矢量字库提取出每个字形的高质量的笔画。同时点集注册为该算法的一个核心步骤,针对这一问题,本发明提出了基于结构信息的非刚性点集注册,从而有效提高了点集注册的精确度。

为了实现上述目的,本发明提出的一种面向矢量字形的汉字笔画自动提取方法,主要包括以下四个步骤:

第一步,对待提取的目标字形(在后文中简称“数据字”,其对应的骨架点集和轮廓点集简称“数据点集”和“数据轮廓”)以及模板数据库(如楷体、行楷等)中与其相对应的带有笔画归类信息的模板字形(在后文中简称“模板字”,其对应的骨架点集和轮廓点集简称“模板点集”和“模板轮廓”)进行骨架提取。该步骤执行完毕后,得到两个点集,即数据点集和模板点集。

第二步,将数据点集、模板点集以及模板点集的笔画归属关系作为基于结构信息的非刚性点集注册算法的输入,注册完毕后得到数据点集的笔画归属关系。也就是说,在此步执行完毕后,目标字的骨架被划分成了若干子集,每个子集包括若干骨架点。

第三步,将数据点集的笔画归属关系转换成数据轮廓段的归属关系,该步骤完成后,对于构成字形轮廓的每一个轮廓段,都有了相应的归属笔画。但是对于每一个笔画所对应的轮廓段,它们是间断不闭合的,这就需要一个算法对每个离散的轮廓段集合进行闭合操作。

第四步,闭合第三步生成的轮廓段,从而得到最终的笔画提取结果。

下面具体说明上述第一步至第四步的实施过程。

1.第一步中的骨架提取方法

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510303067.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top