[发明专利]一种联机手写维吾尔文单词数据增强方法有效
申请号: | 201810451828.7 | 申请日: | 2018-05-12 |
公开(公告)号: | CN108665010B | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 吾加合买提·司马义;玛依热·依布拉音;艾斯卡尔·艾木都拉 | 申请(专利权)人: | 新疆大学 |
主分类号: | G06V30/244 | 分类号: | G06V30/244 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 董芙蓉 |
地址: | 830046 新疆维*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联机 手写 维吾尔文 单词 数据 增强 方法 | ||
1.一种联机手写维吾尔文单词数据增强方法,其特征在于,包括以下步骤:
步骤1、笔画轨迹长度随机变化
以额定长度的轨迹分段为单位访问手写样本轨迹;如果当前分段是横向平直分段,把这个分段右边的样本轨迹坐标以随机长度往右平移;最后,对样本轨迹进行轨迹点插入来弥补平移后产生的轨迹空隙;轨迹分段平直性判断方法是:首先用公式(1)和(2)计算分段的起点、中点和终点形成的转折角度;然后,用公式(3)计算该分段起点和终点相对于横轴形成的倾斜角度;如果转折角度和倾斜角度符合额定平直判断条件,则该分段被认为横向平直分段;
a=|B-C|,b=|A-C|,c=|A-B| (1)
其中,A,B,C分别为分段的起点,中点和终点;a,b,c是由A,B,C形成的三角形的对应边长,∠B和∠O分别是该分段的转折角度和对于横轴的倾斜角度;
步骤2、笔画轨迹弹性变换
2.1笔画轨迹弹性变换通过轨迹分段随机旋转的方法来实现;分段长度和旋转的角度取值范围要相互配合;分段长度过长或旋转角度过大会破坏原始样本的形状,导致样本的可读性不好,甚至会使所属类别变化;如果选的太小则轨迹变换的效果不明显;轨迹分段的旋转用公式(4)和(5)实现;
其中,(xi,yi)和(xrot,yrot)是原始和变换以后的点坐标,N是轨迹段长度,(xc,yc)是旋转中心,θ是旋转角度;分段长度小的时候,选用轨迹段终点或起点作为旋转中心的弹性变换效果比较明显;
2.2多级轨迹弹性变换
在手写轨迹上用不同的分段长度和旋转角度多次进行轨迹弹性变换来实现多级轨迹弹性变换;调好各级相关参数的多级轨迹弹性变换比简单轨迹弹性变换效果更明显;手写轨迹的弹性变换在原始轨迹上会产生轨迹间断或空隙;所以,轨迹弹性变换以后要采用轨迹点插入方法来弥补所造成的轨迹不均匀情况;
步骤3、笔画轨迹随机旋转
在这一步中,将手写单词样本轨迹中的每一个笔画进行随机旋转;笔画轨迹旋转公式如步骤2.1中所示;旋转中心即笔画轨迹中所有点坐标的平均值,采用步骤2.1中的公式(4)来计算;对不同长度的笔画采用不同幅度的旋转角度;
步骤4、整体样本随机倾斜化
样本倾斜化通过对样本轨迹或形状进行随机错切变换来实现;错切变换只对一个坐标进行变换,另一个坐标却保持不变;手写轨迹进行错切变换之后的点坐标用公式(6)计算;
X=x+y·tan(θ),Y=y (6)
其中(x,y)和(X,Y)分别是错切变换以前和以后的点坐标;θ是错切变换角度;
步骤5、整体样本随机旋转
最后,对整体样本轨迹或形状进行随机旋转来模仿实际手写中的总体基线倾斜化的情况;对总体样本轨迹的整体样本随机旋转用公式(4)和(5)来实现;
步骤6、笔画轨迹随机点丢弃
为了避免一些非常小但有区分性作用的延迟笔画的失去,在笔画轨迹上进行随机轨迹点丢弃,轨迹点丢弃用一定的比例对原始轨迹点序列进行丢弃或选取,丢弃比例的选用为随机化,以更加逼近实际手写过程;根据具体情况能相应调整丢弃比例的范围。
2.根据权利要求1所述的联机手写维吾尔文单词数据增强方法,其特征在于,在手写轨迹随机变长算法中符合分段转折角度120°和倾斜角度20°的条件的分段被判为横向平直分段;选用的分段长度为5,样本轨迹平移长度是分段长度的1~5倍;对笔画轨迹进行两级轨迹弹性变换;分段长度为5时,旋转角度范围是[-15°,15°];分段长度为20时,旋转角度范围是[-10°,10°];笔画轨迹随机旋转的旋转角度范围是[-5°,5°];用[-45°,45°]范围的错切变换角度实现了整体样本的横向倾斜化;轨迹点丢弃的随机丢弃比例选择范围是(0.2~0.4);整体样本随机旋转角度在[-10°,10°]之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆大学,未经新疆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810451828.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电子笔移动轨迹的处理方法及处理装置
- 下一篇:一种便携式电力自动化装置装置