[发明专利]一种音频噪声的检测方法、装置、存储介质和移动终端有效
申请号: | 201910064238.3 | 申请日: | 2019-01-23 |
公开(公告)号: | CN109658943B | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 庞烨;周新宇;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L25/30;G10L25/24 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 高星 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 噪声 检测 方法 装置 存储 介质 移动 终端 | ||
1.一种音频噪声的检测方法,其特征在于,包括:
获取输入的语音信号,记录当前的系统时间作为噪声检测的起始时间;
对所述语音信号进行分帧;
分别提取分帧后的所述语音信号的GFCC特征和Gabor特征;
将提取到的所述GFCC特征和Gabor特征依次输入CNN神经网络模型的N层卷积层、一层全连接层以及一层softmax层,得到所述语音信号的噪声检测结果,3≤N≤5;
在得到所述语音信号的噪声检测结果时,记录当前的系统时间作为噪声检测的结束时间;
根据所述起始时间和所述结束时间计算得到噪声检测时间;
根据所述噪声检测时间调整所述卷积层的数量N的大小;
其中,所述根据所述噪声检测时间调整所述卷积层的数量N的大小包括:
判断所述噪声检测时间是否超过预设的第一阈值;
若所述噪声检测时间超过所述第一阈值,则进一步判断所述卷积层的数量N是否大于3;
若所述卷积层的数量N大于3,则将所述卷积层的数量N调整为N-1;
所述将提取到的所述GFCC特征和Gabor特征依次输入CNN神经网络模型的N层卷积层、一层全连接层以及一层softmax层,得到所述语音信号的噪声检测结果包括:
将所述GFCC特征和Gabor特征输入至所述CNN神经网络模型的第一层卷积层进行处理,按照上一层卷积层的输出结果作为下一层卷积层的输入的方式,得到所述CNN神经网络模型的最后一层卷积层的输出结果;
将所述最后一层卷积层的输出结果输入至所述全连接层进行处理,得到全连接层的输出结果;
将所述全连接层的输出结果输入至所述softmax层进行处理,得到所述噪声检测结果。
2.根据权利要求1所述的音频噪声的检测方法,其特征在于,还包括:
监测系统的CPU使用率和内存使用率;
判断所述CPU使用率或内存使用率是否超过预设的第二阈值;
若所述CPU使用率或内存使用率超过所述第二阈值,则进一步判断所述卷积层的数量N是否大于3;
若所述卷积层的数量N大于3,则将所述卷积层的数量N调整为N-1。
3.一种音频噪声的检测装置,其特征在于,包括:
语音信号获取模块,用于获取输入的语音信号;
分帧模块,用于对所述语音信号进行分帧;
语音特征提取模块,用于分别提取分帧后的所述语音信号的GFCC特征和Gabor特征;
噪声检测模块,用于将提取到的所述GFCC特征和Gabor特征依次输入CNN神经网络模型的N层卷积层、一层全连接层以及一层softmax层,得到所述语音信号的噪声检测结果,3≤N≤5;
起始时间记录模块,用于当获取输入的语音信号时,记录当前的系统时间作为噪声检测的起始时间;
结束时间记录模块,用于在得到所述语音信号的噪声检测结果时,记录当前的系统时间作为噪声检测的结束时间;
噪声检测时间计算模块,用于根据所述起始时间和所述结束时间计算得到噪声检测时间;
第一卷积层调整模块,用于根据所述噪声检测时间调整所述卷积层的数量N的大小;
其中,所述第一卷积层调整模块包括:
第一判断单元,用于判断所述噪声检测时间是否超过预设的第一阈值;
第二判断单元,用于若所述噪声检测时间超过所述第一阈值,则进一步判断所述卷积层的数量N是否大于3;
第一卷积层调整单元,用于若所述卷积层的数量N大于3,则将所述卷积层的数量N调整为N-1;
所述噪声检测模块包括:
第一处理单元,用于将所述GFCC特征和Gabor特征输入至所述CNN神经网络模型的第一层卷积层进行处理,按照上一层卷积层的输出结果作为下一层卷积层的输入的方式,得到所述CNN神经网络模型的最后一层卷积层的输出结果;
第二处理单元,用于将所述最后一层卷积层的输出结果输入至所述全连接层进行处理,得到全连接层的输出结果;
第三处理单元,用于将所述全连接层的输出结果输入至所述softmax层进行处理,得到所述噪声检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910064238.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频数据处理方法、装置以及相关设备
- 下一篇:直升机声信号增强方法及装置