[发明专利]一种音频降噪方法、设备、系统及存储介质在审

申请号：	202011097916.5	申请日：	2020-10-14
公开（公告）号：	CN114373472A	公开（公告）日：	2022-04-19
发明（设计）人：	杜秉聰;熊飞飞;谭国庆;冯津伟	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L25/30
代理公司：	北京太合九思知识产权代理有限公司 11610	代理人：	张爱;刘戈
地址：	英属开曼群岛大开***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频方法设备系统存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种音频降噪方法，其特征在于，包括：

对音频中的目标音频帧进行噪声检测；

若确定所述目标音频帧中包含符合预设要求的噪声，则获取所述目标音频帧对应的降噪参数；

按照所述降噪参数，对所述目标音频帧进行降噪，以获得降噪后音频帧；

基于所述降噪后音频帧，输出降噪后的所述音频。

2.根据权利要求1所述的方法，其特征在于，还包括：

若确定所述目标音频帧中未包含符合所述预设要求的噪声，则输出所述目标音频帧。

3.根据权利要求1所述的方法，其特征在于，所述对目标音频帧进行噪声检测，包括：

将所述目标音频帧拆分为至少一个帧片段；

分别对所述至少一个帧片段进行噪声检测；

若包含噪声的帧片段满足第一预设条件，则确定所述目标音频帧包含符合预设要求的噪声。

4.根据权利要求3所述的方法，其特征在于，所述第一预设条件包括：

包含噪声的帧片段的数量大于第一数量阈值。

5.根据权利要求3所述的方法，其特征在于，所述若包含噪声的帧片段满足第一预设条件，则确定所述目标音频帧包含符合预设要求的噪声，包括：

若包含噪声的帧片段满足第一预设条件，则将噪声标识字段配置为T，作为所述噪声标识字段在所述目标音频帧下的取值，其中，T为预估的噪声持续时间；

若所述噪声标识字段在所述目标音频帧下的取值大于第一阈值，则确定所述目标音频帧包含符合预设要求的噪声。

6.根据权利要求5所述的方法，其特征在于，还包括：

若所述目标音频帧中包含符合预设要求的噪声的帧片段不满足所述第一预设条件，则将噪声标识字段的原始值减1，作为所述噪声标识字段在所述目标音频帧下的取值，其中，所述原始值为噪声标识字段在所述目标音频帧的上一音频帧下的取值；

若所述噪声标识字段在所述目标音频帧下的取值小于或等于第二阈值，则确定所述目标音频帧未包含符合预设要求的噪声，所述第二阈值小于或等于所述第一阈值。

7.根据权利要求3所述的方法，其特征在于，所述分别对所述至少一个帧片段进行噪声检测，包括：

在目标帧片段中确定符合能量要求的观测帧点；

计算目标帧片段中观测帧点的数量；

若所述观测帧点的数量满足第二预设条件，则确定所述目标帧片段为包含噪声的帧片段；

其中，所述目标帧片段为所述目标音频帧包含的至少一个帧片段中的任意一个。

8.根据权利要求7所述的方法，其特征在于，所述第二预设条件包括：

所述观测帧点的数量大于第二数量阈值。

9.根据权利要求7所述的方法，其特征在于，所述在目标帧片段中确定符合能量要求的观测帧点，包括：

确定目标帧片段对应的频域数据；

基于所述频域数据，分别计算所述目标帧片段包含的各帧点上的能量值；

从各帧点中选择能量值满足第三预设条件的帧点，作为观测帧点。

10.根据权利要求9所述的方法，其特征在于，所述第三预设条件包括：

当前帧点的能量值大于其在前的两个帧点的能量值，且所述当前帧点与其在前的两个帧点之间的能量差均大于预设能量差阈值。

11.根据权利要求1所述的方法，其特征在于，所述获取所述目标音频帧对应的降噪参数，包括：

提取所述目标音频帧的音频特征；

将提取到的音频特征输入降噪模型；

在所述降噪模型中，基于音频特征与降噪参数的映射关系，确定所述目标音频帧对应的降噪参数。

12.根据权利要求1或11所述的方法，其特征在于，所述降噪参数为掩蔽比值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司，未经阿里巴巴集团控股有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011097916.5/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种音频降噪方法、设备、系统及存储介质在审

专利文献下载