[发明专利]用于监控系统中的音频事件检测的系统和方法有效
申请号: | 201980015686.2 | 申请日: | 2019-02-20 |
公开(公告)号: | CN111742365B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | A·萨勒金;冯哲;S·加法扎德甘 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G11B27/28 | 分类号: | G11B27/28;G10L15/02;G10L15/16;G08B13/16;G10L25/30;G10L15/08;G06N3/02 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 毕铮;刘春元 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 监控 系统 中的 音频 事件 检测 方法 | ||
1.一种用于检测和定位音频剪辑中的目标音频事件的方法,所述方法包括:
利用处理器接收音频剪辑;
利用处理器,基于音频剪辑确定多个音频特征;
利用处理器,基于所述多个音频特征使用第一神经网络来确定目标音频事件是否存在于音频剪辑中;
响应于确定目标音频事件存在于音频剪辑中,利用处理器基于(i)所述多个音频特征和(ii)目标音频事件来确定多个向量,所述多个向量中的向量指示所述多个音频特征中的音频特征与目标音频事件之间的相关性;以及
利用处理器,基于所述多个向量使用第二神经网络来确定目标音频事件在音频剪辑内的时间方面的位置。
2.根据权利要求1所述的方法,确定所述多个音频特征还包括:
将音频剪辑分段成具有第一预定长度的多个音频段;以及
针对所述多个音频段中的每个音频段,基于相应音频段确定第一音频特征的集合,所述多个音频特征包括对应于所述多个音频段的第一音频特征的集合。
3.根据权利要求2所述的方法,将音频剪辑分段还包括:
将音频剪辑分段成所述多个音频段,所述多个音频段具有第一预定长度和在所述多个音频段中的相邻音频段之间的第一预定重叠量。
4.根据权利要求2所述的方法,确定所述多个音频特征还包括:
将所述多个音频段中的每个音频段分段成多个音频子段,所述多个音频子段具有比第一预定长度短的第二预定长度;以及
针对每多个音频子段中的每个音频子段,基于相应的音频子段确定第二音频特征的集合;
针对所述多个音频段中的每个音频段,基于对应于相应音频段的多个音频子段的第二音频特征的集合确定音频特征的第一集合。
5.根据权利要求4所述的方法,将每个音频段分段还包括:
将所述多个音频段中的每个音频段分段成所述多个音频子段,所述多个音频子段具有第二预定长度和在所述多个音频子段中的相邻音频子段之间的第二预定重叠量。
6.根据权利要求1所述的方法,其中第一神经网络是卷积神经网络,其具有被配置为执行具有第一扩张因子的卷积操作的至少一个扩张卷积层。
7.根据权利要求6所述的方法,其中,卷积神经网络具有扩张卷积层序列,所述扩张卷积层序列被配置为执行具有增加的扩张因子的卷积操作序列。
8.根据权利要求2所述的方法,确定所述多个向量还包括:
针对所述多个音频段中的每个音频段,基于对应于相应音频段的第一音频特征的集合来确定向量,所述多个向量包括对应于所述多个音频段中的每个音频段的向量。
9.根据权利要求8所述的方法,确定所述多个向量还包括:
针对所述多个音频段中的每个音频段,从定义的音频单词集合标识与对应于相应音频段的第一音频特征的集合最接近匹配的音频单词;以及
针对所述多个音频段中的每个音频段,基于(i)针对相应音频段的所标识的音频单词和(ii)在所定义的音频单词集合中的音频单词与对应向量之间的预定义转换,来确定对应于相应音频段的向量,所述预定义转换依赖于目标音频事件。
10.根据权利要求9所述的方法,其中,通过使用高斯混合模型聚类技术对多个训练音频剪辑的音频特征进行聚类来生成所定义的音频单词集合。
11.根据权利要求9所述的方法,其中,在所定义的音频单词集合中的音频单词与对应向量之间的预定义转换指示在所定义的音频单词集合中的每个相应音频单词与目标音频事件之间的相关性。
12.根据权利要求11所述的方法,其中,在所定义的音频单词集合中的音频单词与对应向量之间的预定义转换是基于多个训练音频剪辑来确定的,所述多个训练音频剪辑被注释以指示目标音频事件的存在和时间方面的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980015686.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于空间系统的智能音频分析装置(IAAA)和方法
- 下一篇:电力变换装置