[发明专利]基于深度完全卷积神经网络的生成对抗网络语音增强方法有效

申请号：	201910755047.1	申请日：	2019-08-15
公开（公告）号：	CN110619885B	公开（公告）日：	2022-02-11
发明（设计）人：	李立欣;程倩倩;李旭;程岳	申请（专利权）人：	西北工业大学
主分类号：	G10L21/02	分类号：	G10L21/02;G10L21/0208;G10L25/30;G10L25/60;G06N3/04
代理公司：	西安维赛恩专利代理事务所(普通合伙) 61257	代理人：	刘艳霞
地址：	710072 陕西***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于深度完全卷积神经网络生成对抗网络语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了基于深度完全卷积神经网络的生成对抗网络语音增强方法，解决了现有高噪声环境下语音信号质量差的问题。该方法包括以下步骤：步骤一、构建一个数据集，包含含噪语音信号和纯净语音信号；获得所述含噪语音信号的语谱图，将语谱图作为生成对抗网络中生成器G的输入；步骤二、生成器G对步骤一所生成的语谱图进行处理，将生成器构建为编码器‑译码器结构，通过编码器部分获得潜在向量z，然后潜在向量z经过译码器部分获得语音信号的输出信号；步骤三、设置判别器D的结构，然后将所述步骤二中的输出信号和所述步骤一中的纯净语音信号作为判别器D的输入，两者不断交互对抗、训练，直至达到平衡，获得增强语音信号。

【技术领域】

本发明属于语音识别技术领域，具体涉及基于深度完全卷积神经网络的生成对抗网络语音增强方法。

【背景技术】

在语音信号中，必然有混杂的各种干扰噪声，语音增强的目的就是最大化地去掉信号中含有的不需要的噪声，改善含噪语音的质量，使听者乐于接受，同时增加语音的可懂性，使听者易于理解。增强后的语音信号要尽可能的在波形上面无限地接近纯净的语音信号，方便后续的信号处理。现如今，语音增强的应用范围十分广泛，比如军事通信、窃听技术和语音识别等方面。然而，由于噪声具有随机性、多样性和不稳定性，找到适用于多种环境的语音增强技术是十分困难的。因此，如何提高模型的泛化能力，也是现如今的工作重点之一。

目前，关于语音增强方面的研究有了长足的进展。传统方法上，有谱减法、维纳滤波(WienerFiltering)、小波变换等，它们的大致思路是先对语音信号进行频域或者时域的变换，估算出噪声的能量信息，然后用含噪信号减去估算出来的噪声信号的信息，得到增强后的语音信号。这些方法在语音信号稳定时可以取得较好的结果。在机器学习得到迅猛发展后，深度神经网络、卷积神经网络、长短期记忆网络也被广泛的用于增强语音信号，并取得了令人满意的结果。

文献1“Enhancement of Speech Corrupted by Acoustic Noise[IEEEInternational Conference on Acoustics,Speech and Signal Processing(ICASSP),1979].”中介绍了使用谱减法增强语音信号的方法，它是假设含噪语音信号中只有假性噪声，然后从含噪语音信号的功率谱中减去估计噪声的功率谱，从而得到纯净语音信号。

文献2“Evaluation of rasta approach with modified parameters forspeech enhancement in communication systems[in ComputersInformatics,Mar.2011,pp.159–162].”中评价了RASTA算法对白噪声和有色噪声抑制的性能，提出了对参数和滤波方法的改进，使其性能优于原RASTA算法。

文献3“Noise Reduction of Speech Signal Using Wavelet Transform withModified Universal Threshold[International Journal of Computer Applications,vol.20,no.5,pp.14-19,2011].”中根据有用信号与噪声信号对应的小波系数的不同来达到语音增强的目的。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西北工业大学，未经西北工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910755047.1/2.html，转载请声明来源钻瓜专利网。

上一篇：音频编码方法和装置
下一篇：一种针对低资源土家语的端到端语音增强方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度完全卷积神经网络的生成对抗网络语音增强方法有效

专利文献下载