[发明专利]一种面向矢量字形的汉字笔画自动提取方法有效
申请号: | 201510303067.7 | 申请日: | 2015-06-04 |
公开(公告)号: | CN104992143B | 公开(公告)日: | 2018-10-26 |
发明(设计)人: | 孙浩;连宙辉;唐英敏;肖建国 | 申请(专利权)人: | 北京大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 冯艺东 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 矢量 字形 汉字 笔画 自动 提取 方法 | ||
1.一种面向矢量字形的汉字笔画自动提取方法,其步骤包括:
1)对待提取的目标字形以及模板数据库中与其相对应的带有笔画归类信息的模板字形进行骨架提取,得到数据点集和模板点集;
2)将数据点集、模板点集以及模板点集的笔画归属关系作为输入,进行基于结构信息的非刚性点集注册,得到数据点集的笔画归属关系;
3)将数据点集的笔画归属关系转换成数据轮廓段的归属关系,使构成字形轮廓的每一个轮廓段具有相应的归属笔画;
4)连接生成的轮廓段,得到最终的矢量笔画提取结果。
2.如权利要求1所述的方法,其特征在于,步骤1)进行骨架提取的方法为下列中的一种:并行连通性保持骨架提取算法、宽度独立细化算法、优化并行细化算法。
3.如权利要求1所述的方法,其特征在于,步骤2)所述基于结构信息的非刚性点集注册,是将结构化信息加入到原始的点集一致性移动算法中,通过加入局部化优化算子,并进行局部化的点集匹配,实现全局迭代和局部迭代相结合的点集注册。
4.如权利要求3所述的方法,其特征在于,在原始的点集一致性移动算法中,吸引力矩阵G是一个M*M的矩阵,该矩阵使用下式来计算:
其中yi表示第i个数据点,β为归一化参数,加入局部化优化算子后的吸引力矩阵由下式来计算:
其中lij表示第i个点和第j个点的归属关系,若两点属于同一子集,则lij为1,否则为0。
5.如权利要求3或4所述的方法,其特征在于,步骤2)所述基于结构信息的非刚性点集注册包括如下步骤:
2-1)对输入的两个点集即数据点集和模板点集进行带有局部化优化算子的一致性点集移动算法;该过程是全局范围内的点集注册,注册完毕后根据归属矩阵中的信息得到数据点集的初次划分结果;
2-2)对每一个子集执行局部带有局部化优化算子的一致性点集移动算法;该过程是局部的点集注册,注册完成后返回全局注册,直到迭代收敛或到达规定的迭代次数,即得到最终的注册结果。
6.如权利要求1所述的方法,其特征在于,步骤3)将数据点集的归属关系转换成数据轮廓段的归属关系的方法是:
3-1)对每一个轮廓段的起始点和终止点,使用最近邻方式计算出其第一归属以及第二归属,第一归属是指距离当前点最近的骨架点所对应的归属,第二归属是指和第一归属不同并且距离当前点最近的骨架点所对应的归属,从而得到一个轮廓段归属的候选集合;
3-2)对轮廓段归属的候选集合进行一次遍历,计算每一个归属笔画中的骨架点到两个端点距离和的最小值,使用该最小值所对应的笔画归属作为当前轮廓段最终对应的笔画归属。
7.如权利要求1所述的方法,其特征在于,步骤4)对轮廓段进行连接的方法是:
4-1)定义笔画所对应的轮廓段集合为S,集合S中每一个元素代表一个离散的轮廓段,集合S中每一个轮廓段的两个端点构成笔画端点集合E;
4-2)计算集合E中不同端点两两之间的距离,构造出端点的距离矩阵M;
4-3)根据启发式规则对M中两两点之间的距离进行更新;
4-4)对于每个端点,连接与之经过启发式规则调整后距离最近的相应端点,然后将这两个端点所对应的笔画段融合成一个笔画段,并且将连接后的端点从集合E中删除,同时更新M中的距离值;
4-5)对于步骤4-4)完成后未闭合的轮廓段,对其进行强行闭合。
8.如权利要求7所述的方法,其特征在于,步骤4-3)所述启发式规则包括:
4-3a)配对并进行连接的两点位于不同的轮廓段;
4-3b)配对并进行连接的两点之间的连线不穿越骨架;
4-3c)配对并进行连接的两点之间的连线位于字形的有效区域内部。
9.如权利要求8所述的方法,其特征在于,步骤4-3)所述三个启发式规则的优先级关系是:4-3a)>4-3b)=4-3c)。
10.如权利要求8所述的方法,其特征在于,步骤4-3)所述对M中两两点之间的距离进行更新包括:若两点位于同一个轮廓段,则它们之间的距离增大2000-3000,使所有配对的点均位于不同的轮廓段;若两点连线穿越了骨架,则两点的距离增加1000-1500选择连线不穿越骨架的端点进行连接;若两点之间的连线位于字形的有效区域之外,则距离增加1000-1500,选择连线位于字形有效区域内部的端点进行连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510303067.7/1.html,转载请声明来源钻瓜专利网。