[发明专利]噪声检测的方法和装置在审
申请号: | 202011504715.2 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112614512A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 陈洲旋 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10L25/81 | 分类号: | G10L25/81;G10L25/87 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 宁立存 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 噪声 检测 方法 装置 | ||
本申请提供了一种噪声检测的方法,属于音频处理技术领域。所述方法包括:在目标音频中确定待定噪声音频段,其中,所述待定噪声音频段中的每个音频帧均满足噪声参数条件,且与所述待定噪声音频段相邻的音频帧均不满足所述噪声参数条件;确定与所述待定噪声音频段相邻、且时长与所述待定噪声音频段的时长满足预设条件的至少一个参考音频段;基于所述待定噪声音频段、所述至少一个参考音频段以及噪声判定模型,确定所述待定噪声音频段对应的噪声判定结果,其中,所述噪声判定结果用于指示所述待定噪声音频段是否存在噪声。采用本申请,不需要对目标音频中的所有音频段都进行复杂的模型处理,节省了检测时间,提高了检测效率。
技术领域
本申请涉及音频处理技术领域,特别涉及一种噪声检测的方法和装置。
背景技术
随着互联网的发展,数字音乐迅速流行。对音频进行噪声检测是一种非常常见的处理,例如,音乐平台会对存入音频库的歌曲音频进行噪声检测,K歌应用程序在对录制的歌曲音频进行去噪处理之前需要进行噪声检测。
相关技术中噪声检测方法是:将音频划分为若干固定时长的音频段,根据噪声判定模型判定每个音频段是否存在噪声。
上述的噪声检测方法,需要对音频的每个音频段都进行复杂的模型处理,需要消耗较长的时间,处理效率较低。
发明内容
本申请实施例提供了一种噪声检测的方法,能够解决相关技术中噪声检测时需要对音频的每个音频段都进行复杂的模型处理进而需要消耗较长时间、处理效率较低的问题。所述技术方案如下:
第一方面,提供了一种噪声检测的方法,所述方法包括:
在目标音频中确定待定噪声音频段,其中,所述待定噪声音频段中的每个音频帧均满足噪声参数条件,且与所述待定噪声音频段相邻的音频帧均不满足所述噪声参数条件;
确定与所述待定噪声音频段相邻、且时长与所述待定噪声音频段的时长满足预设条件的至少一个参考音频段;
基于所述待定噪声音频段、所述至少一个参考音频段以及噪声判定模型,确定所述待定噪声音频段对应的噪声判定结果,其中,所述噪声判定结果用于指示所述待定噪声音频段是否存在噪声。
在一种可能的设计中,所述在目标音频中确定待定噪声音频段,包括:
在所述目标音频中从首个音频帧开始向后逐个检测音频帧是否满足噪声参数条件;
当检测到第一音频帧满足噪声参数条件、且所述第一音频帧的前一个音频帧不满足噪声参数条件时,将所述第一音频帧确定为开始音频帧;
当检测到第二音频帧满足噪声参数条件、且所述第二音频帧的后一个音频帧不满足噪声参数条件时,将所述第二音频帧确定为结束音频帧;
将所述开始音频帧至所述结束音频帧的音频段,确定为待定噪声音频段。
在一种可能的设计中,所述待定噪声音频段中的音频帧的数目大于或等于数目阈值。
在一种可能的设计中,所述噪声参数条件包括音频帧的能量大于能量阈值、音频帧的过零率大于过零率阈值以及音频帧的频谱平坦度大于频谱平坦度阈值。
在一种可能的设计中,所述至少一个参考音频段包括第一参考音频段和/或第二参考音频段;
所述确定与所述待定噪声音频段相邻、且时长与所述待定噪声音频段的时长满足预设条件的至少一个参考音频段,包括:
在所述待定噪声音频段之前,确定与所述待定噪声音频段相邻、且时长与所述待定噪声音频段的时长的比值为第一数值的第一参考音频段;和/或,
在所述待定噪声音频段之后,确定与所述待定噪声音频段相邻、且时长与所述待定噪声音频段的时长的比值为第二数值的第二参考音频段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011504715.2/2.html,转载请声明来源钻瓜专利网。