[发明专利]基于幅度谱的语音降噪方法、装置、设备及存储介质有效
申请号: | 202210223124.0 | 申请日: | 2022-03-09 |
公开(公告)号: | CN114333882B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 李杰;王广新;杨汉丹 | 申请(专利权)人: | 深圳市友杰智新科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0232;G10L25/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;陈秋波 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 幅度 语音 方法 装置 设备 存储 介质 | ||
1.一种基于幅度谱的语音降噪方法,其特征在于,所述方法包括:
获取目标语音对应的待降噪频谱图;
采用预设的降噪模型,对所述待降噪频谱图进行降噪处理,得到已降噪频谱图,其中,所述降噪模型依次包括:幅度谱降噪单元、频谱修正单元和掩码增益与减益单元,所述幅度谱降噪单元用于进行幅度谱降噪,所述频谱修正单元用于进行频谱修正;
对所述已降噪频谱图进行语音信号重建,得到所述目标语音对应的目标干净语音;
所述采用预设的降噪模型,对所述待降噪频谱图进行降噪处理,得到已降噪频谱图的步骤,包括:
将所述待降噪频谱图输入所述幅度谱降噪单元进行幅度谱降噪,得到增强幅度谱;
从所述待降噪频谱图中提取带噪相位谱;
将所述增强幅度谱和所述带噪相位谱输入所述频谱修正单元进行频谱修正,得到频谱修正数据;
对所述频谱修正数据和所述增强幅度谱进行残差连接,得到待分析频谱图;
将所述待分析频谱图输入所述掩码增益与减益单元进行掩码,得到所述已降噪频谱图;
所述将所述增强幅度谱和所述带噪相位谱输入所述频谱修正单元进行频谱修正,得到频谱修正数据的步骤,包括:
根据所述增强幅度谱和所述带噪相位谱生成增强频谱图;
将所述增强频谱图输入所述频谱修正单元的编码器进行特征提取,得到多个单层编码特征和目标编码特征;
将所述目标编码特征输入所述频谱修正单元的残差学习层进行频谱修正,得到待解码音频特征;
将各个所述单层编码特征和所述待解码音频特征输入所述频谱修正单元的解码器进行解码,得到所述频谱修正数据。
2.根据权利要求1所述的基于幅度谱的语音降噪方法,其特征在于,所述将所述待降噪频谱图输入所述幅度谱降噪单元进行幅度谱降噪,得到增强幅度谱的步骤,包括:
从所述待降噪频谱图中提取带噪幅度谱;
采用所述幅度谱降噪单元的降维层,对所述带噪幅度谱进行降维,得到已降维幅度谱;
采用所述幅度谱降噪单元的幅度谱降噪层集,对所述已降维幅度谱进行幅度谱降噪,得到待升维特征,其中,所述幅度谱降噪层集中包括至少一个幅度谱降噪层,所述幅度谱降噪层采用LSTM网络;
采用所述幅度谱降噪单元的升维层,对所述待升维特征进行升维,得到幅度掩码值;
根据所述幅度掩码值和所述带噪幅度谱,确定所述增强幅度谱。
3.根据权利要求1所述的基于幅度谱的语音降噪方法,其特征在于,所述编码器的编码层的数量和所述解码器的解码层的数量均为n,所述将各个所述单层编码特征和所述待解码音频特征输入所述频谱修正单元的解码器进行解码,得到所述频谱修正数据的步骤,包括:
对第n+1-m个所述单层编码特征进行降维处理,得到待处理编码特征,其中,m是大于0的整数,并且m小于或等于n;
将第m-1个所述解码层的输出和所述待处理编码特征进行相同位置的元素值相加,得到第m个待处理特征;
对第m个所述待处理特征进行解码,得到第m个单层解码特征;
将第n个所述单层解码特征作为所述频谱修正数据;
其中,当m等于1时,将所述待解码音频特征作为第m-1个所述解码层的输出,当m大于1时,将第m-1个所述单层解码特征作为第m-1个所述解码层的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市友杰智新科技有限公司,未经深圳市友杰智新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210223124.0/1.html,转载请声明来源钻瓜专利网。