[发明专利]基于生成对抗网络的复数域语音增强方法、系统及介质有效
申请号: | 201910984076.5 | 申请日: | 2019-10-16 |
公开(公告)号: | CN110739002B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 刘刚;陈志广 | 申请(专利权)人: | 中山大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/30 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 谭武艺 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于生成对抗网络的复数域语音增强方法、系统及介质,本发明复数域语音增强方法的实施步骤包括:获取带噪声的语音;将语音采用傅里叶变换后再采用笛卡尔坐标表示得到带噪声的实数谱和虚数谱;将带噪声的实数谱和虚数谱输入预先完成训练的生成对抗网络的生成器,得到去除噪声后的纯净语音的实数谱和虚数谱;将纯净语音的实数谱和虚数谱基于逆傅里叶变换生成干净的语音。本发明能够从语音信号中更好地剔除噪声、生成干净的语音,有效解决相位难以预测的问题,能够有效提高增强后语音的听觉效果,可有效提高语音识别系统在噪声环境下的语音识别准确率。 | ||
搜索关键词: | 基于 生成 对抗 网络 复数 语音 增强 方法 系统 介质 | ||
【主权项】:
1.一种基于生成对抗网络的复数域语音增强方法,其特征在于实施步骤包括:/n1)获取带噪声的语音;/n2)将语音采用傅里叶变换后再采用笛卡尔坐标表示得到带噪声的实数谱R和虚数谱I;/n3)将带噪声的实数谱R和虚数谱I输入预先完成训练的生成对抗网络的生成器,通过生成器的编码器Encoder将实数谱R和虚数谱I组成的输入IR编码为高语义特征Encoder
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910984076.5/,转载请声明来源钻瓜专利网。