[发明专利]降噪方法及装置、电子设备、存储介质有效
申请号: | 202010994517.2 | 申请日: | 2020-09-21 |
公开(公告)号: | CN111933171B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 邓峰;姜涛;李岩 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 薛娇 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方法 装置 电子设备 存储 介质 | ||
本公开关于音频降噪方法及装置、电子设备、存储介质,其中方法包括:对当前音频信号执行加窗分帧操作获得多个音频帧;分别对多个音频帧执行傅里叶变换操作,获得多个音频帧的原始幅度信息和原始相位信息;输入多个音频帧的原始幅度信息至预先训练好的降噪模型,获得所述降噪模型输出的降噪系数;利用降噪系数分别对多个音频帧的原始幅度信息执行降噪操作,获得多个音频帧的降噪幅度信息;分别组合多个音频帧的降噪幅度信息和原始相位信息,并执行逆傅里叶变换操作,获得多个降噪音频帧;将多个降噪音频帧进行加窗和叠接相加操作,获得并输出降噪音频信号。本公开可以使用降噪系数对原始幅度信息执行降噪操作,从而达到抑制环境噪声的目的。
技术领域
本公开涉及互联网技术领域,尤其涉及降噪方法及装置、电子设备、存储介质。
背景技术
随着科学技术的不断进步,电子设备中应用种类越来越多,且,许多应用都会涉及音频信号,例如短视频应用中用户录制短视频时会涉及到音频信号、直播类应用中用户直播时会涉及到音频信号、实时通讯类应用中实时传输时涉及到音频信号等等。
由于用户使用电子设备的环境较为复杂,所以音频信号不尽包括用户音频还包括环境噪声。为此需要一种降噪方法,以便降低音频信号中的环境噪声。
发明内容
本公开提供一种噪声抑制方法及装置、电子设备、存储介质,以至少解决相关技术中抑制音频信号中的环境噪声的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供了一种音频降噪方法,包括:
对当前音频信号执行加窗分帧操作获得多个音频帧;
分别对所述多个音频帧执行傅里叶变换操作,获得所述多个音频帧的原始幅度信息和原始相位信息;
输入所述多个音频帧的原始幅度信息至预先训练好的降噪模型,获得所述降噪模型输出的降噪系数;
利用所述降噪系数分别对所述多个音频帧的原始幅度信息执行降噪操作,获得所述多个音频帧的降噪幅度信息;
分别组合所述多个音频帧的降噪幅度信息和原始相位信息,并执行逆傅里叶变换操作,获得多个降噪音频帧;
将所述多个降噪音频帧进行加窗和叠接相加操作,获得并输出降噪音频信号。
其中,所述降噪模型包括:
多层级联的且使用空洞卷积的残差学习模块的下采样单元;
多层级联的且使用空洞卷积的残差学习模块的上采样单元;
以及,下采样单元与上采样单元之间至少设有一个门控注意力模块。
其中,在所述对当前音频信号执行加窗分帧操作获得多个音频帧之前,还包括:
确定训练样本集;其中一个训练样本包括原始语音的已有幅度信息,以及,原始语音中纯净语音的幅度信息和原始语音中环境噪声的幅度信息;
利用所述训练样本集对降噪模型进行有监督训练;
在达到训练结束条件后获得训练好的降噪模型。
其中,所述训练结束条件包括噪声感知代价函数趋于收敛;
其中,所述噪声感知代价函数包括两部分:语音预测损失和噪声估计损失。
其中,所述噪声感知代价函数采用如下公式表示:
其中,Y为原始语音的已有幅度信息、X为原始语音中纯净语音的幅度信息、N为原始语音中环境噪声的幅度信息、为原始语音中纯净语音的幅度信息经过降噪模型后输出的降噪幅度信息,为加权因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010994517.2/2.html,转载请声明来源钻瓜专利网。