[发明专利]一种联机手写维吾尔文单词数据增强方法有效

专利信息
申请号: 201810451828.7 申请日: 2018-05-12
公开(公告)号: CN108665010B 公开(公告)日: 2022-01-04
发明(设计)人: 吾加合买提·司马义;玛依热·依布拉音;艾斯卡尔·艾木都拉 申请(专利权)人: 新疆大学
主分类号: G06V30/244 分类号: G06V30/244
代理公司: 北京方圆嘉禾知识产权代理有限公司 11385 代理人: 董芙蓉
地址: 830046 新疆维*** 国省代码: 新疆;65
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种联机手写维吾尔文单词数据增强方法,分析手写维吾尔文单词的书写特性,提出了手写轨迹随机变长的联机手写数据增强算法。然后,结合多种适合联机手写单词的数据增强算法,实现联机手写维吾尔文单词数据增强。结合多种算法的数据增强方法效果明显,可以用少量的原始样本来构造更多不同手写风格的有效伪造样本,同时保证其可读性。此数据增强方法具有较强的通用性,可以为其它文字手写数据增强研究作为直接参考。
搜索关键词: 一种 联机 手写 维吾尔文 单词 数据 增强 方法
【主权项】:
1.一种联机手写维吾尔文单词数据增强方法,其特征在于,包括以下步骤:步骤1、笔画轨迹长度随机变化以额定长度的轨迹分段为单位访问手写样本轨迹;如果当前分段是横向平直分段,把这个分段右边的样本轨迹坐标以随机长度往右平移;最后,对样本轨迹进行轨迹点插入来弥补平移后产生的轨迹空隙;轨迹分段平直性判断方法是:首先用公式(1)和(2)计算分段的两头和中点形成的转折角度;然后,用公式(3)计算该分段两头对于横轴形成的倾斜角度;如果转折角度和倾斜角度符合额定平直判断条件,则该分段被认为横向平直分段;a=|B‑C|,b=|A‑C|,c=|A‑B|    (1)其中,A,B,C分别为轨迹分段的起点,中点和终点;a,b,c是由A,B,C形成的三角形的对应边长,∠B和∠O是该轨迹段的中心转折角度和对于横轴的倾斜角度;步骤2、笔画轨迹弹性变换2.1采用的笔画轨迹弹性变换把轨迹分段随机旋转的方法来实现;分段长度和旋转的角度取值范围要相互配合;分段长度过长或旋转角度过大会破坏原始样本的形状,伪造样本的可读性不好甚至所属类别变化;如果选的太小则轨迹变换的效果不明显;轨迹分段的旋转用公式(4)和(5)实现;其中,(xi,yi)和(xrot,yrot)是原始和变换以后的点坐标,N是轨迹段长度,(xc,yc)是旋转中心,θ是旋转角度(弧度);分段长度小的时候,选用轨迹段终点或起点作为旋转中心的弹性变换效果比较明显;2.2多级轨迹弹性变换在手写轨迹上用不同的分段长度和旋转角度多次进行轨迹弹性变换来实现多级轨迹弹性变换;调好各级相关参数的多级轨迹弹性变换比简单轨迹弹性变换效果更明显;分段长度调大的时候,旋转角度的范围要小一点;分段长度调小则能加大旋转角度范围;手写轨迹的弹性变换在原始轨迹上产生轨迹间断或空隙;所以,轨迹弹性变换以后要采用轨迹点插入等方法来弥补所造成的轨迹不均匀情况;步骤3、笔画轨迹随机旋转在这一步中,在手写样本轨迹中的每一个笔画为单词进行随机旋转;笔画轨迹旋转公式如步骤2所示;旋转中心是笔画轨迹的重点,即笔画轨迹中所有点坐标的平均值,步骤2中的公式来计算;旋转角度的范围小一点就行,否则在较长的笔画轨迹旋转后出现异常;或者考虑对不同长度的笔画采用不同幅度为旋转角度;步骤4、整体样本随机倾斜化采用的样本倾斜化通过对样本轨迹或形状进行随机错切变换来实现;错切变换只对一个坐标进行变换,另一个坐标却保持不变;手写轨迹进行错切变换之后的点坐标用公式(6)计算;X=x+y·tan(θ),Y=y    (6)其中(x,y)和(X,Y)分别是错切变换以前和以后的点坐标;θ是错切变换角度;步骤5、整体样本随机旋转最后,对整体样本轨迹或形状进行随机旋转来模仿实际手写中的总体基线倾斜化的情况;对总体样本轨迹的倾斜化还是用步骤2中的公式来实现;选用的旋转中心是总体样本轨迹的重点;旋转角度的范围能大一些;步骤6、笔画轨迹随机点丢弃为了避免一些非常小但有区分性作用的延迟笔画的失去,在笔画轨迹上进行随机轨迹点丢弃,轨迹点丢弃用一定的比例对原始轨迹点序列进行丢弃或选取,采用把丢弃比例的选用也为随机化,更加逼近实际手写过程,根据具体情况能相应调整丢弃比例的范围。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆大学,未经新疆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810451828.7/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top