[发明专利]一种基于机器学习的声事件检测系统及方法在审
申请号: | 202010157799.0 | 申请日: | 2020-03-09 |
公开(公告)号: | CN111477213A | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 万同堂;周翊 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L15/20;G10L25/24;G08B21/18 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 事件 检测 系统 方法 | ||
1.一种基于机器学习的声事件检测方法,其特征在于,该方法具体包括以下步骤:
S1:拾音模块完成音频采集;
S2:识别模块先将采集的音频进行数据增强处理,然后根据构建训练完的机器学习识别模型对采集的音频进行识别;
S3:后台管理模块将识别模型预测的结果进行展示。
2.根据权利要求1所述的一种基于机器学习的声事件检测方法,其特征在于,所述步骤S2中,数据增强处理具体包括:利用不同的噪声源对训练数据进行加噪,然后再利用OMLSA降噪系统对带噪数据进行降噪,之后输入识别模型作为训练数据。
3.根据权利要求2所述的一种基于机器学习的声事件检测方法,其特征在于,所述OMLSA降噪系统对带噪数据进行降噪的过程包括:首先将带噪数据进行分帧加窗,然后做短时傅里叶变换得到频谱信息,其次利用自适应滤波原理估计噪声的频谱增益从而达到降噪的效果,最后将输出的频谱数据通过IFFT、窗口合成和去重叠的操作,得到增强的音频数据。
4.根据权利要求1所述的一种基于机器学习的声事件检测方法,其特征在于,所述步骤S2中,构建和训练机器学习识别模型具体包括:首先从输入音频中提取MFCCs特征和频谱特征,然后经过DNN和CRNN网络进行建模,最后通过模型融合的方法将两者融合。
5.根据权利要求4所述的一种基于机器学习的声事件检测方法,其特征在于,所述DNN网络由全连接层和非线性激活层构成;DNN的输入是扁平化的特征矩阵,它输入到d个隐藏的全连接层中,每个层有n个神经元;每个全连接层后面采用一个基于整流线性单元的激活函数;首先利用滑动窗口将输入数据流划分为多个数据帧;输出是一个线性laver,接着是一个软最大层,产生k个声音事件的输出概率。
6.根据权利要求4所述的一种基于机器学习的声事件检测方法,其特征在于,所述CRNN网络由CNN和RNN组合而成,CRNN模型首先是一个卷积层,然后是一个RNN对信号进行编码,最后是一个密集的全连接层来映射信息;最后在输出层使用一个完全连接的层来融合两个网络的输出。
7.一种基于机器学习的声事件检测系统,其特征在于,该系统包括:拾音模块、识别模块和后台管理模块;
所述拾音模块用于完成音频采集的工作,由麦克风和相应的外围电路组成;
所述识别模块由基于机器学习方法的识别模型组成,完成音频的实时识别功能;
所述后台管理模块用于完成识别结果的展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010157799.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多旋翼无人机的航向引导方法和装置
- 下一篇:一种塑胶跑道双组分面漆