[发明专利]音频降噪方法、装置、计算机设备及存储介质有效
申请号: | 202110758661.0 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113421584B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 张之勇;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L21/0264 | 分类号: | G10L21/0264;G10L25/24;G10L25/93 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 方法 装置 计算机 设备 存储 介质 | ||
1.一种音频降噪方法,其特征在于,包括下述步骤:
获取带有噪声的待处理音频;
提取所述待处理音频的梅尔频率倒谱系数;
将所述梅尔频率倒谱系数输入声学特征预测模型,以根据所述梅尔频率倒谱系数预测无噪音频声学特征,所述无噪音频声学特征包括频谱包络、对数基频以及非周期性特征;
计算所述无噪音频声学特征的变化趋势特征;
对所述待处理音频进行清音浊音判断,得到清音浊音判断信息;
根据所述无噪音频声学特征、所述变化趋势特征和所述清音浊音判断信息进行音频合成,得到无噪音频。
2.根据权利要求1所述的音频降噪方法,其特征在于,在所述获取带有噪声的待处理音频的步骤之前,还包括:
获取训练样本,所述训练样本包括从有噪训练音频中提取到的梅尔频率倒谱系数,以及从无噪训练音频中提取到的无噪音频声学特征,所述无噪音频声学特征包括频谱包络、对数基频以及非周期性特征,所述有噪训练音频是在所述无噪训练音频中添加噪声得到的;
将所述训练样本输入声学特征初始预测模型,以根据所述训练样本中的梅尔频率倒谱系数和无噪音频声学特征训练所述声学特征初始预测模型,得到声学特征预测模型。
3.根据权利要求1所述的音频降噪方法,其特征在于,所述提取所述待处理音频的梅尔频率倒谱系数的步骤包括:
对所述待处理音频进行预处理;
对预处理后的待处理音频进行快速傅里叶变换,得到频域表示的待处理音频;
计算所述频域表示的待处理音频的功率谱;
将所述功率谱输入三角滤波器,并计算所述三角滤波器输出信号的对数能量;
对所述对数能量进行离散余弦变换,得到梅尔频率倒谱系数。
4.根据权利要求1所述的音频降噪方法,其特征在于,所述计算所述无噪音频声学特征的变化趋势特征的步骤包括:
计算所述无噪音频声学特征的一阶导数和二阶导数;
将计算得到的一阶导数和二阶导数确定为所述无噪音频声学特征的变化趋势特征。
5.根据权利要求1所述的音频降噪方法,其特征在于,所述获取所述待处理音频的清音浊音判断信息的步骤包括:
对所述待处理音频进行预处理,得到若干组帧数据;
对于每组帧数据,确定帧数据的基频;
根据所述基频确定所述帧数据中的清音部分和浊音部分,得到清音浊音判断信息。
6.根据权利要求1所述的音频降噪方法,其特征在于,所述根据所述无噪音频声学特征、所述变化趋势特征和所述清音浊音判断信息进行音频合成,得到无噪音频的步骤包括:
运行预设的包络平滑算法,以基于所述变化趋势特征对所述无噪音频声学特征中的频谱包络进行平滑处理,得到平滑处理后的频谱包络;
将所述平滑处理后的频谱包络、所述对数基频以及所述非周期性特征确定为无噪音频声学子特征;
对于每组清音浊音判断信息,从确定的无噪音频声学子特征中选取与清音浊音判断信息相对应的无噪音频声学子特征;
将选取到的无噪音频声学子特征输入声码器,以通过所述声码器合成无噪音频。
7.根据权利要求6所述的音频降噪方法,其特征在于,所述对于每组清音浊音判断信息,从确定的无噪音频声学子特征中选取与清音浊音判断信息相对应的无噪音频声学子特征的步骤包括:
对于清音浊音判断信息中的每个布尔标志,当布尔标志为清音标志时,选取与所述布尔标志相关联的非周期性特征;
当所述布尔标志为浊音标志时,选取与所述布尔标志相关联的平滑处理后的频谱包络、对数基频以及非周期性特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110758661.0/1.html,转载请声明来源钻瓜专利网。