[发明专利]一种基于机器学习的声事件检测系统及方法在审
申请号: | 202010157799.0 | 申请日: | 2020-03-09 |
公开(公告)号: | CN111477213A | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 万同堂;周翊 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L15/20;G10L25/24;G08B21/18 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 事件 检测 系统 方法 | ||
本发明涉及一种基于机器学习的声事件检测系统及方法,属于音频检测和故障检测技术领域。该系统包括:拾音模块、识别模块和后台管理模块;拾音模块用于完成音频采集的工作,由麦克风和相应的外围电路组成;识别模块由基于机器学习方法的识别模型组成,完成音频的实时识别功能;后台管理模块用于完成识别结果的展示。本发明系统可以更加精确的检测到声事件并且在噪声干扰的情况下具有更好的鲁棒性。
技术领域
本发明属于音频检测和故障检测技术领域,涉及一种基于机器学习的声事件检测方法。
背景技术
声事件检测技术通过实时检测声事件的类型和发生时间,从而对监控系统中的突发事件进行检测、报警等操作。当前声事件检测主要应用在智能家居、工业探伤、故障检测等领域。现有的技术一般采用高斯混合模型(GMM)因马尔科夫模型等方法对实时音频进行分类。但是,当前技术存在一些问题,如:分类和检测模型不准确导致实际应用出现声事件的误报、漏报问题;模型训练阶段需要大量的数据进行训练,由于声事件的出现频率往往比较低而导致训练数据短缺的问题。
因此,目前亟需一种能够提高声事件检测准确率的系统,解决声事件出现频率低导致训练数据稀缺导致检测结果不准确的问题。
本发明提出了一套基于机器学习方法的鲁棒声事件检测系统,该发明提出的基于机器学习方法的声事件检测模型大大提升了声事件检测的准确率,另外本发明提出的训练数据增强的方法也解决了训练数据稀缺的情况下的模型训练问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于机器学习的声事件检测系统及方法,解决声事件出现频率低导致训练数据稀缺情况下的模型训练问题,从而提高声事件检测准确率和鲁棒性。
为达到上述目的,本发明提供如下技术方案:
1)一种基于机器学习的声事件检测方法,具体包括以下步骤:
S1:拾音模块完成音频采集;
S2:识别模块先将采集的音频进行数据增强处理,然后根据构建训练完的机器学习识别模型对采集的音频进行识别;
S3:后台管理模块将识别模型预测的结果进行展示。
进一步,所述步骤S2中,数据增强处理具体包括:利用不同的噪声源对训练数据进行加噪,然后再利用OMLSA降噪系统对带噪数据进行降噪,之后输入识别模型作为训练数据。
更进一步,所述OMLSA降噪系统对带噪数据进行降噪的过程包括:首先将带噪数据进行分帧加窗,然后做短时傅里叶变换得到频谱信息,其次利用自适应滤波原理估计噪声的频谱增益从而达到降噪的效果,最后将输出的频谱数据通过IFFT、窗口合成和去重叠等操作,得到增强的音频数据。
进一步,所述步骤S2中,构建和训练机器学习识别模型具体包括:首先从输入音频中提取MFCCs特征和频谱特征,然后经过DNN和CRNN网络进行建模,最后通过模型融合的方法将两者融合。
更进一步,所述DNN网络由全连接层和非线性激活层构成;DNN的输入是扁平化的特征矩阵,它输入到d个隐藏的全连接层中,每个层有n个神经元;每个全连接层后面采用一个基于整流线性单元(ReLU)的激活函数;首先利用滑动窗口将输入数据流划分为多个数据帧;64毫秒的持续时间和40%的重叠。我们提取了40维的MFCC。输出是一个线性laver,接着是一个软最大层,产生k个声音事件的输出概率,用于进一步的后验处理。
更进一步,所述CRNN网络由CNN和RNN组合而成,利用卷积lavers的局部时间/空间相关性和使用最新层的声音特征的全局时间依赖性。CRNN模型首先是一个卷积层,然后是一个RNN对信号进行编码,最后是一个密集的全连接层来映射信息;为了将两个网络结合起来,最后在输出层使用一个完全连接的层(两个隐藏层有128和64个单元)来融合两个网络的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010157799.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多旋翼无人机的航向引导方法和装置
- 下一篇:一种塑胶跑道双组分面漆