[发明专利]空中手写单词序列合成模型生成方法及合成方法有效
申请号: | 202011031569.6 | 申请日: | 2020-09-27 |
公开(公告)号: | CN112162635B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 薛洋;张鑫 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06F3/0346;G06F40/284;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 郑浦娟 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 空中 手写 单词 序列 合成 模型 生成 方法 | ||
1.一种空中手写单词序列合成模型生成方法,其特征在于,所述方法包括:
从语料库中获取英文单词,作为合成目标;
根据合成目标,从空中手写字符数据集中获取对应英文字符样本,各英文字符样本包括惯性传感信号;
按照合成目标,将上述获取的各英文字符样本进行拼接,得到拼接单词样本;
从空中手写单词数据集中获取英文单词样本,作为真实单词样本,真实单词样本包括惯性传感信号;
将拼接单词样本作为生成对抗网络中生成器的输入,生成器的输出和真实单词样本作为生成对抗网络中判别器的输入,对生成对抗网络进行对抗训练,将生成对抗网络中训练后的生成器作为合成模型。
2.根据权利要求1所述的空中手写单词序列合成模型生成方法,其特征在于,按照合成目标,各英文字符样本进行拼接的具体过程如下:
根据合成目标单词中各字符的顺序,对获取到的英文字符样本进行排列,其中每两个字符样本之间留空N个采样点,N为常量;
根据每一处留空两端的数值进行线性插值,使得每一处留空两端的字符样本通过线性线段进行连接;
在每一留空处两端分别对应向左和向右延伸n个采样点的范围内,用窗长为n的滤波器进行平滑滤波,得到最终拼接单词样本。
3.根据权利要求1所述的空中手写单词序列合成模型生成方法,其特征在于,对生成对抗网络进行对抗训练的过程具体如下:
将拼接单词样本输入到生成对抗网络中的生成器,通过生成器输出合成单词样本;
将生成器输出的合成单词样本与真实单词样本分别输入到生成对抗网络中的判别器中,进行对抗训练,使得合成单词样本不断趋近真实单词样本,得到收敛的生成器。
4.根据权利要求1所述的空中手写单词序列合成模型生成方法,其特征在于,生成对抗网络训练过程中,生成器训练的损失函数Lgenerator为:
Lgenerator=Ladv+Ldist;
其中,Ladv表示生成器的对抗损失,Ldist表示距离损失函数;
在Ladv中,pA表示所有拼接单词样本组成的数据集合,x~pA表示x属于拼接单词样本集合,即x表示拼接单词样本,x是生成器的输入,G表示生成对抗网络中的生成器,D表示生成对抗网络中的判别器,G(x)表示生成器的输出样本,即合成单词样本;D(G(x))表示判别器对合成单词样本的判别结果,E表示取均值操作;
在Ldist中,pA表示所有拼接单词样本组成的数据集合,xi,xj~pA表示xi,xj属于拼接单词样本集合,即xi,xj表示任意的两个拼接单词样本,xi,xj均为生成器的输入,μA,σA表示拼接单词样本集合的均值与方差;G表示生成对抗网络中的生成器,G(xi)、G(xj)表示生成器的输出样本,即合成单词样本;E表示取均值操作;
生成对抗网络训练过程中,判别器训练的损失函数如下:
其中,Ldisc表示判别器的对抗损失,pA表示所有拼接单词样本组成的数据集合,xa~pA表示xa属于拼接单词样本集合,即xa表示拼接单词样本,xa是生成器的输入,G表示生成对抗网络中的生成器,D表示生成对抗网络中的判别器,G(xa)表示生成器的输出样本,即合成单词样本;D(G(xa))表示判别器对合成单词样本的判别结果,pr表示所有真实单词样本组成的数据集合,xr~pr表示xr属于真实单词样本集合,即xr表示真实单词样本,D(xr)表示判别器对真实单词样本的判别结果,E表示取均值操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011031569.6/1.html,转载请声明来源钻瓜专利网。