[发明专利]一种多模块抑制不同种类噪声的双噪声语音增强方法有效
申请号: | 201910914176.0 | 申请日: | 2019-09-25 |
公开(公告)号: | CN110491406B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 蓝天;叶文政;惠国强;刘峤;李森;钱宇欣;吕忆蓝;彭川;李萌 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0316;G10L25/30 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 何健雄;廖祥文 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模块 抑制 不同 种类 噪声 语音 增强 方法 | ||
本发明公开一种多模块抑制不同种类噪声的双噪声语音增强方法,包括以下步骤:S1:对多种类型的噪声进行分阶段建模,对于输入的带噪语音,在每个阶段通过噪声抑制模块提取并过滤一种或多种噪声特征;其中,每个噪声抑制模块的损失函数均不相同;S2:过程中被抑制部分噪声的幅度谱和原始带噪语音幅度谱拼接并输入最终的神经网络;本发明提出一种多模块分阶段抑制不同种类噪声的双噪声语音增强方法,每个模块分别抑制一种或几种不同类型的噪声,同时提高其在混合噪声环境和低信噪比环境的性能,再将增强结果集成到后一阶段,它在每个阶段使用神经网络学习带噪幅度谱到较纯净幅度谱的映射,对特征进行提炼,得到更加纯净的幅度谱。
技术领域
本发明属于语音增强技术领域,尤其涉及一种多模块抑制不同种类噪声的双噪声语音增强方法。
背景技术
语音增强算法是一项重要的语音处理技术,可为语音识别系统、听觉辅助设备和军事窃听装置提供支持。目前语音识别算法准确率已经达到较高水平,在一些公开数据集中甚至超过熟练的听写转录人员。然而由于噪声或混响干扰的存在,语音增强后语音识别算法才能达到理想的效果。现在的语音增强算法只对较高信噪比的含单种噪声的带噪语音有良好的表现。在会议环境、战场环境和街道环境等真实场景下,环境中会存在多种噪声而且信噪比有较大的变化范围。对于双噪声场景,一般算法不易表现出良好的泛化性。而在低信噪比环境下,由于音频中噪声能量占主导,语音增强算法性能会明显恶化。
发明内容
本发明提供一种多模块抑制不同种类噪声的双噪声语音增强方法,旨在解决上述存在的问题。
本发明是这样实现的,一种多模块抑制不同种类噪声的双噪声语音增强方法,包括以下步骤:
S1:对多种类型的噪声进行分阶段建模,对于输入的带噪语音,在每个阶段通过噪声抑制模块提取并过滤一种或多种噪声特征;其中,每个噪声抑制模块的损失函数均不相同;
S2:过程中被抑制部分噪声的幅度谱和原始带噪语音幅度谱拼接并输入最终的神经网络;
S3:使用神经网络学习带噪幅度谱到纯净幅度谱的映射,对特征进行提炼,得到纯净的幅度谱;
S4:中间噪声抑制模块损失函数的拟合目标为带噪语音,最终噪声抑制模块损失函数的拟合目标为纯净语音。
进一步的,所述带噪语音由以下公式表示:
式中X表示带噪语音,S表示纯净语音,Ni表示一种加性噪声,共有k种噪声。
进一步的,所述噪声抑制模块包含2层全连接层和2层LSTM,其执行基本的抑制带噪语音中某一种或多种噪声的任务,其功能由以下公式表示:
X′=f(X)
上式表示增强语音X′,其噪声数量少于降噪以前,f表示NRM网络。
进一步的,步骤S1中,包含两个阶段,所述第一阶段包含两个噪声抑制模块,其中,每个噪声抑制模块的输入都为含两种噪声的带噪语音,输出幅度谱的带噪语音中噪声种类少于输入。
进一步的,第一阶段得到2个含不同噪声类型的语音幅度谱,每个幅度谱含有不同的语音特征信息;两个噪声抑制模块及其损失函数分别由以下公式表示:
X21=f1l(X1)
X22=f12(X1)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910914176.0/2.html,转载请声明来源钻瓜专利网。