[发明专利]检测噪声的方法和装置在审
申请号: | 202011446230.2 | 申请日: | 2020-12-09 |
公开(公告)号: | CN112614507A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 徐东 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/21;G10L25/18 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 宁立存 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 噪声 方法 装置 | ||
1.一种检测噪声的方法,其特征在于,所述方法包括:
获取录制的目标人声音频;
将目标人声音频划分为多个音频段;
获取每个音频段对应的功率信息,基于每个音频段的功率信息和人耳听觉参考信息,在所述多个音频段中确定待识别音频段,其中,所述功率信息包括所述音频段中各音频帧的多个频点的功率值,所述人耳听觉参考信息包括多个频点对应的人耳听觉功率阈值;
提取每个待识别音频段的特征信息,将每个待识别音频段对应的特征信息,分别输入到噪声判定模型中,得到每个待识别音频段对应的噪声判定结果,其中,所述待识别音频段的特征信息基于所述待识别音频段的至少一种人耳感知频谱特征确定;
基于每个待识别音频段对应的噪声判定结果,确定所述目标人声音频对应的噪声判定结果。
2.根据权利要求1所述的方法,其特征在于,所述获取每个音频段对应的功率信息,基于每个音频段的功率信息和人耳听觉参考信息,在所述多个音频段中确定待识别音频段,包括:
对于每个音频段,将所述音频段的各音频帧中各频点的功率值分别与对应的频点的人耳听觉功率阈值进行比较,若存在功率值大于人耳听觉功率阈值的频点,则将所述音频段确定为待识别音频段。
3.根据权利要求1所述的方法,其特征在于,所述提取每个待识别音频段的特征信息,将每个待识别音频段对应的特征信息,分别输入到噪声判定模型中,得到每个待识别音频段对应的噪声判定结果之前,包括:对每个所述待识别音频段进行淡入处理和淡出处理。
4.根据权利要求1所述的方法,其特征在于,所述提取每个待识别音频段的特征信息,将每个待识别音频段对应的特征信息,分别输入到噪声判定模型中,得到每个待识别音频段对应的噪声判定结果,包括:
对于每个待识别音频段,提取所述待识别音频段的多个子特征信息,对所述多个子特征信息进行标准化处理,将标准化处理后的多个子特征信息组合成矩阵,作为所述待识别音频段对应的特征信息,其中,所述多个子特征信息包括至少一种人耳感知频谱特征,所述人耳感知频谱特征为相对频谱变换-感知线性预测RASTA-PLP特征、感知线性预测PLP系数、PLP一阶差分系数或PLP二阶差分系数。
5.根据权利要求4所述的方法,其特征在于,所述子特征信息为向量或矩阵,所述对所述多个子特征信息进行标准化处理,包括:
对于每个子特征信息,确定所述子特征信息中各元素的平均值和标准差,计算每个元素减所述平均值的差值,并计算每个元素对应的差值与所述标准差的商,将每个元素对应的商分别确定为对应的标准化处理后的元素,基于多个标准化处理后的元素,确定标准化处理后的子特征信息。
6.根据权利要求4所述的方法,其特征在于,所述多个子特征信息还包括梅尔频谱特征和/或谱熵。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述基于每个待识别音频段对应的噪声判定结果,确定所述目标人声音频对应的噪声判定结果,包括:
基于每个待识别音频段对应的噪声判定结果,确定所述目标人声音频中存在噪声的目标时间段;
显示噪声提示信息,其中,所述噪声提示信息用于指示所述目标时间段中存在噪声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011446230.2/1.html,转载请声明来源钻瓜专利网。