[发明专利]音频降噪方法、装置、计算机设备及存储介质有效
申请号: | 202110758661.0 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113421584B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 张之勇;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L21/0264 | 分类号: | G10L21/0264;G10L25/24;G10L25/93 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 方法 装置 计算机 设备 存储 介质 | ||
本申请实施例属于人工智能领域,涉及一种音频降噪方法、装置、计算机设备及存储介质,方法包括:获取带有噪声的待处理音频;提取待处理音频的梅尔频率倒谱系数;将梅尔频率倒谱系数输入声学特征预测模型,以根据梅尔频率倒谱系数预测无噪音频声学特征,无噪音频声学特征包括频谱包络、对数基频以及非周期性特征;计算无噪音频声学特征的变化趋势特征;对待处理音频进行清音浊音判断,得到清音浊音判断信息;根据无噪音频声学特征、变化趋势特征和清音浊音判断信息进行音频合成,得到无噪音频。此外,本申请还涉及区块链技术,无噪音频可存储于区块链中。本申请提高了降噪后音频的质量。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种音频降噪方法、装置、计算机设备及存储介质。
背景技术
随着计算机技术的发展,越来越多地使用计算机进行音频数据处理。在音频数据处理中,常常涉及到语音增强。音频增强是指当音频中混合有噪声时,从噪声背景中提取有用的音频信号,抑制、降低噪声干扰。
理想情况下,音频增强应该在不降低音频质量的前提下消除噪声。然而,传统的语音增强技术往往会有音频的过度抑制以及对噪声的抑制不足等问题,带来频谱损失,影响了音频的自然性与可懂性,容易产生听感失真。
发明内容
本申请实施例的目的在于提出一种音频降噪方法、装置、计算机设备及存储介质,以解决音频降噪时频谱损失的问题。
为了解决上述技术问题,本申请实施例提供一种音频降噪方法,采用了如下所述的技术方案:
获取带有噪声的待处理音频;
提取所述待处理音频的梅尔频率倒谱系数;
将所述梅尔频率倒谱系数输入声学特征预测模型,以根据所述梅尔频率倒谱系数预测无噪音频声学特征,所述无噪音频声学特征包括频谱包络、对数基频以及非周期性特征;
计算所述无噪音频声学特征的变化趋势特征;
对所述待处理音频进行清音浊音判断,得到清音浊音判断信息;
根据所述无噪音频声学特征、所述变化趋势特征和所述清音浊音判断信息进行音频合成,得到无噪音频。
为了解决上述技术问题,本申请实施例还提供一种音频降噪装置,采用了如下所述的技术方案:
音频获取模块,用于获取带有噪声的待处理音频;
系数提取模块,用于提取所述待处理音频的梅尔频率倒谱系数;
特征预测模块,用于将所述梅尔频率倒谱系数输入声学特征预测模型,以根据所述梅尔频率倒谱系数预测无噪音频声学特征,所述无噪音频声学特征包括频谱包络、对数基频以及非周期性特征;
特征计算模块,用于计算所述无噪音频声学特征的变化趋势特征;
清浊判断模块,用于对所述待处理音频进行清音浊音判断,得到清音浊音判断信息;
音频合成模块,用于根据所述无噪音频声学特征、所述变化趋势特征和所述清音浊音判断信息进行音频合成,得到无噪音频。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
获取带有噪声的待处理音频;
提取所述待处理音频的梅尔频率倒谱系数;
将所述梅尔频率倒谱系数输入声学特征预测模型,以根据所述梅尔频率倒谱系数预测无噪音频声学特征,所述无噪音频声学特征包括频谱包络、对数基频以及非周期性特征;
计算所述无噪音频声学特征的变化趋势特征;
对所述待处理音频进行清音浊音判断,得到清音浊音判断信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110758661.0/2.html,转载请声明来源钻瓜专利网。