[发明专利]一种多模块抑制不同种类噪声的双噪声语音增强方法有效
申请号: | 201910914176.0 | 申请日: | 2019-09-25 |
公开(公告)号: | CN110491406B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 蓝天;叶文政;惠国强;刘峤;李森;钱宇欣;吕忆蓝;彭川;李萌 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0316;G10L25/30 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 何健雄;廖祥文 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模块 抑制 不同 种类 噪声 语音 增强 方法 | ||
1.一种多模块抑制不同种类噪声的双噪声语音增强方法,其特征在于,包括以下步骤:
S1:对多种类型的噪声进行两个阶段建模,对于输入的带噪语音,在每个阶段通过噪声抑制模块提取并过滤一种或多种噪声特征;其中,每个噪声抑制模块的损失函数均不相同;
S2:噪声抑制模块提取过滤过程中被抑制部分噪声的幅度谱和原始带噪语音幅度谱拼接并输入最终的神经网络;
S3:使用神经网络学习带噪幅度谱到纯净幅度谱的映射,对特征进行提炼,得到纯净的幅度谱;
S4:中间噪声抑制模块损失函数的拟合目标为带噪语音,最终噪声抑制模块损失函数的拟合目标为纯净语音。
2.根据权利要求1所述的双噪声语音增强方法,其特征在于:所述带噪语音由以下公式表示:
式中X表示带噪语音,S表示纯净语音,Ni表示一种加性噪声,共有k种噪声。
3.根据权利要求1所述的双噪声语音增强方法,其特征在于:所述噪声抑制模块包含2层全连接层和2层LSTM,其执行基本的抑制带噪语音中某一种或多种噪声的任务,其功能由以下公式表示:
X′=f(X)
上式表示增强语音X′,其噪声数量少于降噪以前,f表示噪声抑制模块(NoiseReduction Module,NRM)网络。
4.根据权利要求1所述的双噪声语音增强方法,其特征在于,步骤S1中,包含两个阶段,分别为第一阶段和第二阶段,所述第一阶段包含两个噪声抑制模块,其中,每个噪声抑制模块的输入都为含两种噪声的带噪语音,输出幅度谱的带噪语音中噪声种类少于输入。
5.根据权利要求4所述的双噪声语音增强方法,其特征在于:第一阶段得到2个含不同类型噪声的语音幅度谱,每个幅度谱含有不同的语音特征信息;两个噪声抑制模块及其损失函数分别由以下公式表示:
X21=f11(X1)
X22=f12(X1)
式中,X1=S+N1+N2、X21=S+N1、X22=S+N2,X1表示含两种噪声的混合带噪语音,X21、X22表示含一种噪声的带噪语音,X21、X22含有噪声种类不同;li表示噪声抑制模块的损失函数,i=1,2。
6.根据权利要求5所述的双噪声语音增强方法,其特征在于:所述第二阶段只含一个噪声抑制模块,不限定过滤某种噪声,输入为第一阶段产生的含丰富语音特征信息的多个幅度谱,这些幅度谱被拼接送入一个噪声抑制模块,噪声抑制模块的输出为最终增强语音,表示为:
X2=[X1;X21;X22]
X3=f2(X2)
式中表示X2由X1、X21、X22拼接形成;
该噪声抑制模块的损失函数表示为:
。
7.根据权利要求6所述的双噪声语音增强方法,其特征在于,还包括以下步骤:对3个模块进行联合训练,最终的损失函数表示为:
loss=α1*l1+α2*l2+…+αm*lm
其中li表示每个模块的损失函数,αi表示每个模块的权重,共有m个模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910914176.0/1.html,转载请声明来源钻瓜专利网。