[发明专利]一种基于约束朴素生成对抗网络的语音增强方法在审
申请号: | 201911051607.1 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110808057A | 公开(公告)日: | 2020-02-18 |
发明(设计)人: | 袁丛琳;孙成立 | 申请(专利权)人: | 南昌航空大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0208;G10L25/30;G06N3/08 |
代理公司: | 南昌洪达专利事务所 36111 | 代理人: | 黄文亮 |
地址: | 330000 江*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 约束 朴素 生成 对抗 网络 语音 增强 方法 | ||
本发明公开了一种基于约束朴素生成对抗网络的语音增强方法,包括步骤:1)噪声数据收集和标记;2)语音分帧加窗;3)幅度压缩;4)输入约束朴素生成对抗网络训练;5)幅度解压缩;6)逆短时傅里叶变换,生成增强语音。本发明的优点是:通过生成对抗网络中的生成模型和判别模型之间的对抗学习,不断增强生成模型生成样本的能力,最终得到干净语音样本的分布;对语音或噪声的统计分布没有任何假设;采取复数谱映射的方法,在训练样本中增加了相位信息。本发明巧妙地解决了语音和噪声信号分布难以估计问题,有助于提高语音可懂度,避免相位失真。
技术领域
本发明涉及语音处理技术领域,具体涉及一种基于约束朴素生成对抗网络的语音增强方法。
背景技术
语音作为人类交流的主要媒介,已经在移动通信、多媒体技术等领域发挥了重要作用。在人工智能方兴未艾的大背景下,语音识别、声纹识别等技术的广泛应用也对语音信号的质量提出了更高的要求。然而在实际的语音采集和对话交流场景中,语音信号往往会受到各种噪声的干扰,主要包括背景噪声、信道噪声和干扰噪声。语音增强是解决噪声污染的有效技术。
传统的语音增强方法主要有四种:(1)谱减法,是利用语音的短时平稳性将含噪语音信号的功率谱减去噪声信号的功率谱,便可得到纯净语音信号的功率谱估计。此方法容易产生“音乐噪声”问题;(2)维纳滤波器法,是在假定语音和加性噪声都服从高斯分布的条件下,从给定的含噪语音中通过维纳滤波器估计出语音的谱系数。当滤波器参数的调节到达极限或者处于非稳态噪声环境时,维纳滤波法的效果不佳;(3)基于谱幅度最小均方误差估计法(MMSE),是假设语音幅度谱满足某种分布,如高斯分布、伽玛分布等,通过统计学习估计出谱系数的概率分布。然而,假设的分布和真实的分布往往并不一致;(4)子空间法,是将纯净语音置于一个低秩的信号子空间,噪声信号置于一个噪声子空间,并且信号子空间和噪声子空间相互正交。此方法通过将噪声子空间置零,再对信号子空间进行滤波以得到纯净的语音信号。此方法未考虑语音和噪声的先验知识,难以完全去除噪声子空间。
发明内容
本发明所要解决的问题是:提供一种基于约束朴素生成对抗网络的语音增强方法,巧妙地解决了语音和噪声信号分布难以估计问题,有助于提高语音可懂度,避免相位失真。
本发明为解决上述问题所提供的技术方案为:一种基于约束朴素生成对抗网络的语音增强方法,所述方法包括以下步骤,
(1)、噪声数据收集和标记;
(2)、语音分帧加窗;
(3)、幅度压缩;
(4)、输入约束朴素生成对抗网络训练;
(5)、幅度解压缩;
(6)、逆短时傅里叶变换,生成增强语音。
优选的,所述步骤(1)中噪声数据收集和标记具体包括以下步骤:
(1.1)数据收集:采用NOIZEUS库的语音作为纯净语音,采用NOISEX~92噪声库中的噪声作为噪声信号,采样频率均为8KHz;
(1.2)数据标记:每种噪声分别以-5dB,0dB,5dB,10dB和15dB的信噪比叠加到纯净语音,以此作为含噪语音数据集。
优选的,所述步骤(2)中语音分帧加窗是指采用长度为512,帧移为50%的汉明窗对含噪语音分帧,短时傅里叶变换的点数为1024。
优选的,所述步骤(3)中幅度压缩是指使用双曲正切函数对复数谱串接向量进行幅度压缩,把取值范围限制在[-1,1],双曲正切函数定义为
优选的,所述步骤(4)中输入约束朴素生成对抗网络训练可分为网络模型初始化、训练判别器、训练生成器及输出训练模型,具体如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌航空大学,未经南昌航空大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911051607.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种驱动器用IGBT模块的结温预测方法
- 下一篇:层叠封装结构及其制造方法