[发明专利]一种文字数字化处理方法、装置及设备在审
申请号: | 202111633597.X | 申请日: | 2021-12-28 |
公开(公告)号: | CN114494508A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 吴仕意;万鸣炜;李开 | 申请(专利权)人: | 深圳市优必选科技股份有限公司 |
主分类号: | G06T11/20 | 分类号: | G06T11/20;G06T11/60 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 李木燕 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 数字化 处理 方法 装置 设备 | ||
1.一种文字数字化处理方法,其特征在于,所述方法包括:
获取目标文字的第一骨架信息,所述第一骨架信息为从目标图像中提取到的多个像素点,所述目标图像为所述目标文字对应的图像;
修正所述第一骨架信息中存在错误的像素点,得到第二骨架信息;
对所述第二骨架信息进行笔画划分和笔顺还原,得到第一笔顺信息;
根据线宽信息,对所述第一笔顺信息中的像素点进行加宽处理,得到所述目标文字的标准点集。
2.如权利要求1所述的文字数字化处理方法,其特征在于,所述修正所述第一骨架信息中存在错误的像素点,得到第二骨架信息,包括:
获取满足预设条件的若干个像素点,所述预设条件为具有多个连通方向的任一像素点;
确定满足预设条件的若干个像素点中相邻的两个像素点之间的距离;
当满足预设条件的若干个像素点中相邻的两个像素点之间的距离小于阈值时,将相邻的两个像素点合并修正为一个像素点。
3.如权利要求1所述的文字数字化处理方法,其特征在于,所述对所述第二骨架信息进行笔画划分和笔顺还原,得到第一笔顺信息,包括:
根据连通性遍历规则,对所述第二骨架信息进行笔画划分,得到第一笔画信息;
将所述第一笔画信息和标准笔画信息进行比较;
根据比较结果还原所述目标文字的笔顺,得到所述第一笔顺信息。
4.如权利要求3所述的文字数字化处理方法,其特征在于,所述根据连通性遍历规则,对所述第二骨架信息进行笔画划分,得到第一笔画信息中,包括:
根据第一方向优先级,遍历所述第二骨架信息中的所有像素点;
根据遍历结果,完成对所述第二骨架信息的笔画划分,得到所述第一笔画信息。
5.如权利要求4所述的文字数字化处理方法,其特征在于,所述根据第一方向优先级,遍历所述第二骨架信息中的所有像素点中,包括:
当遍历到具有两个或两个以上连通方向的像素点时,获取在当前像素点之前遍历的前一个像素点的连通方向;
如果当前像素点的连通方向中存在与前一个像素点相同的连通方向,则按照与前一个像素点相同的连通方向继续进行连通性遍历。
6.如权利要求5所述的文字数字化处理方法,其特征在于,在所述当遍历到具有两个或两个以上连通方向的像素点时,获取在当前像素点之前遍历的前一个像素点的连通方向之后,还包括:
如果当前像素点的连通方向中不存在与前一个像素点相同的连通方向,则按照第二方向优先级继续进行连通性遍历。
7.如权利要求3所述的文字数字化处理方法,其特征在于,所述根据连通性遍历规则,对所述第二骨架信息进行笔画划分,得到第一笔画信息中,包括:
统计所述第一笔画信息中的笔画数量;
确定统计得到的所述笔画数量与所述目标文字的实际笔画数量是否一致;
当统计得到的所述笔画数量与所述目标文字的实际笔画数量不一致时,按照第三方向优先级,对所述第二骨架信息中具有多个连通方向的像素点进行连通性遍历,直至统计得到的所述笔画数量与所述目标文字的实际笔画数量相一致。
8.如权利要求1所述的文字数字化处理方法,其特征在于,所述根据线宽信息,对所述第一笔顺信息中的像素点进行加宽处理,得到所述目标文字的标准点集中,包括:
获取所述目标文字的轮廓信息,所述轮廓信息由多个轮廓点构成;
计算并获取所述第一笔顺信息中每个像素点到所述轮廓点的距离信息;
将所述距离信息中最小的距离值作为当前计算的像素点的线宽信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优必选科技股份有限公司,未经深圳市优必选科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111633597.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种化疗栓塞组合物及其应用
- 下一篇:一株赖氨酸芽孢杆菌及对植物的促生应用