[发明专利]基于对事件子部分的序列的建模的声音事件检测在审
申请号: | 201811376608.9 | 申请日: | 2018-11-19 |
公开(公告)号: | CN110010156A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 库巴·洛帕特卡;托比亚斯·博克雷;马特乌什·考特瑞斯基 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G06N3/08;G06K9/62 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 宗晓斌 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音事件 声音特征 音频信号 检测 目标声音 建模 傅里叶变换 训练分类器 关联 基于事件 聚类技术 频谱能量 时间排序 序列解码 训练数据 分类器 无监督 子空间 应用 | ||
1.一种处理器实现的用于检测声音事件的方法,所述方法包括:
由基于处理器的系统从音频信号提取一个或多个声音特征;
由所述基于处理器的系统向所提取的一个或多个声音特征应用受训分类器,以识别所述音频信号的声音事件子部分并生成与所述子部分相关联的分数;以及
由所述基于处理器的系统执行所述声音事件子部分和相关联的分数的序列解码,以检测声音事件。
2.如权利要求1所述的方法,其中,所述序列解码基于所述声音事件子部分的时间排序和对所述相关联的分数与阈值分数值的比较。
3.如权利要求1所述的方法,还包括:在通过对训练数据应用的子空间聚类生成的声音事件子部分上训练所述分类器,所述训练数据包括目标声音事件。
4.如权利要求3所述的方法,其中,所述子空间聚类是基于k-means聚类、高斯混合模型聚类、以及DenStream聚类中的至少一者的无监督子空间聚类。
5.如权利要求3所述的方法,还包括:至少针对包括目标声音事件的所述训练数据的子集生成参考注释,所述参考注释指示所述目标声音事件的子部分,并且其中,所述子空间聚类是基于约束k-means聚类、播种k-means聚类、以及高斯混合模型聚类和DenStream聚类的半监督变体中的至少一者的半监督子空间聚类。
6.如权利要求1-5中任一项所述的方法,其中,所述序列解码基于加权有限状态转换器、循环神经网络(RNN)、以及长短期记忆RNN中的至少一者。
7.如权利要求1-5中任一项所述的方法,其中,所提取的一个或多个声音特征包括表示所述音频信号的至少一部分的短期傅里叶变换、表示所述音频信号的至少一部分的滤波器组特征、表示所述音频信号的至少一部分的梅尔频率倒谱系数、以及表示所述音频信号的至少一部分的频谱形状描述符中的至少一者。
8.如权利要求1-5中任一项所述的方法,其中,所述分类器是深度神经网络、支持向量机、决策树分类器、k最近邻分类器、随机森林分类器、梯度提升分类器、以及基于逻辑回归的分类器中的至少一者。
9.一种用于声音事件检测的系统,所述系统包括:
特征提取电路,其从音频信号提取声音特征;
分类器电路,其基于所提取的声音特征识别所述音频信号的声音事件子部分,并生成与所述子部分相关联的分数;以及
序列解码器电路,其执行所述声音事件子部分和相关联的分数的序列解码以检测声音事件。
10.如权利要求9所述的系统,其中,所述序列解码基于所述声音事件子部分的时间排序和对所述相关联的分数与阈值分数值的比较。
11.如权利要求9所述的系统,还包括:分类器训练电路,其在通过对训练数据应用的子空间聚类生成的声音事件子部分上训练所述分类器,所述训练数据包括目标声音事件。
12.如权利要求11所述的系统,其中,所述子空间聚类是基于k-means聚类、高斯混合模型聚类、以及DenStream聚类中的至少一者的无监督子空间聚类。
13.如权利要求11所述的系统,其中,所述训练数据的至少一个子集包括目标声音事件和相关联的参考注释,所述参考注释指示所述目标声音事件的子部分,并且其中,所述子空间聚类是基于约束k-means聚类、播种k-means聚类、以及高斯混合模型聚类和DenStream聚类的半监督变体中的至少一者的半监督子空间聚类。
14.如权利要求9-11中任一项所述的系统,其中,所述序列解码器电路采用加权有限状态转换器、循环神经网络(RNN)、以及长短期记忆RNN中的至少一者。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811376608.9/1.html,转载请声明来源钻瓜专利网。