[发明专利]空中手写单词序列合成模型生成方法及合成方法有效
申请号: | 202011031569.6 | 申请日: | 2020-09-27 |
公开(公告)号: | CN112162635B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 薛洋;张鑫 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06F3/0346;G06F40/284;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 郑浦娟 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 空中 手写 单词 序列 合成 模型 生成 方法 | ||
本发明一种空中手写单词序列合成模型生成方法及合成方法,首先从语料库中获取英文单词,作为合成目标,然后从空中手写字符数据集中获取英文字符样本;按照合成目标,将上述获取的英文字符样本进行拼接,得到拼接单词样本;从空中手写单词数据集中获取英文单词样本,作为真实单词样本,将拼接单词样本和真实样本分别对应作为生成对抗网络中生成器和判别器的输入,对生成对抗网络进行对抗训练,将生成对抗网络中训练后的生成器作为合成模型。基于本发明方法,能够在空中手写单词样本以及空中手写字母样本数量有限的条件下,大量地合成逼真的空中手写单词序列,从而扩充了空中手写单词训练集,极大的提升了空中手写单词识别模型识别的精度。
技术领域
本发明涉及空中手写单词识别技术领域,特别涉及一种空中手写单词序列合成模型生成方法及合成方法。
背景技术
随着智能可穿戴设备以及智能手机的大规模应用,基于惯性传感器的可穿戴设备的人体动作识别等在日常生活中发挥着越来越重要的作用。但是现有的技术研究极度依赖数据集的量级大小,尤其是类似空中手写单词识别任务。空中手写单词识别任务通常需要百万级的数据量才可以让机器学习模型充分学习到数据集的语料信息。而在实际应用中,由于资金以及采集时间过长等条件限制,使得大规模空中手写单词序列的采集异常困难。
发明内容
本发明的第一目的在于克服现有技术的缺点与不足,提供一种空中手写单词序列合成模型生成方法,该方法通过训练生成对抗网络获取到用于合成单词样本的合成模型,使得合成模型能够合成非常逼近真实单词样本的合成单词样本,获取到的合成单词样本即空中手写单词序列更加逼真有效。
本发明的第二目的在于提供一种空中手写单词序列合成方法,该方法能够在空中手写单词样本以及空中手写字母样本数量有限的条件下,大量地合成逼真的空中手写单词序列,从而扩充了空中手写单词训练集,极大的提升了空中手写单词识别模型识别的精度。
本发明的第三目的在于提供一种空中手写单词序列合成模型生成装置。
本发明的第四目的在于提供一种空中手写单词序列合成装置。
本发明的第五目的在于提供一种存储介质。
本发明的第六目的在于提供一种计算设备。
本发明的第一目的通过下述技术方案实现:一种空中手写单词序列合成模型生成方法,所述方法包括:
从语料库中获取英文单词,作为合成目标;
根据合成目标,从空中手写字符数据集中获取对应英文字符样本,各英文字符样本包括惯性传感信号;
按照合成目标,将上述获取的各英文字符样本进行拼接,得到拼接单词样本;
从空中手写单词数据集中获取英文单词样本,作为真实单词样本,真实单词样本包括惯性传感信号;
将拼接单词样本作为生成对抗网络中生成器的输入,生成器的输出和真实单词样本作为生成对抗网络中判别器的输入,对生成对抗网络进行对抗训练,将生成对抗网络中训练后的生成器作为合成模型。
优选的,按照合成目标,各英文字符样本进行拼接的具体过程如下:
根据合成目标单词中各字符的顺序,对获取到的英文字符样本进行排列,其中每两个字符样本之间留空N个采样点,N为常量;
根据每一处留空两端的数值进行线性插值,使得每一处留空两端的字符样本通过线性线段进行连接;
在每一留空处两端分别对应向左和向右延伸n个采样点的范围内,用窗长为n的滤波器进行平滑滤波,得到最终拼接单词样本。
优选的,对生成对抗网络进行对抗训练的过程具体如下:
将拼接单词样本输入到生成对抗网络中的生成器,通过生成器输出合成单词样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011031569.6/2.html,转载请声明来源钻瓜专利网。