[发明专利]音频事件检测方法和装置无效
申请号: | 201010590438.1 | 申请日: | 2010-12-06 |
公开(公告)号: | CN102486920A | 公开(公告)日: | 2012-06-06 |
发明(设计)人: | 刘昆;吴伟国;卢鲤;赵庆卫 | 申请(专利权)人: | 索尼公司;中国科学院声学研究所 |
主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L15/02 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 郭定辉 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 事件 检测 方法 装置 | ||
1.一种基于长时特性的音频事件检测方法,所述方法包括如下步骤:
将输入音频流分成一系列的小段;
对每个段提取短时和长时特征;并且
根据所提取的短时和长时特征,得到关于音频流的分类结果。
2.如权利要求1所述的音频事件检测方法,还包括步骤:经过平滑处理得到事件检测结果。
3.如权利要求1所述的音频事件检测方法,其中,在提取短时和长时特征之后,采用降维算法对MSV(Mean Super Vector)特征矢量进行降维,以去除特征的冗余信息。
4.如权利要求1所述的音频事件检测方法,其中,所述短时和长时特征是基于段和基于帧之一的。
5.如权利要求1所述的音频事件检测方法,其中,所述分类结果通过支持向量机分类器来进行。
6.如权利要求4所述的音频事件检测方法,其中,基于帧的短时特征至少包括以下特征之一:PLP、LPCC、LFCC、Pitch、短时能量、子带能量分布、亮度和带宽。
7.如权利要求4所述的音频事件检测方法,其中,基于段的长时特征至少包括以下特征之一:谱通量、长时平均谱和LPC熵。
8.如权利要求2所述的音频事件检测方法,其中,在平滑处理中所使用的平滑规则如下:
(1)if{s(n)==1 and s(n+1)!=1 and s(n+2)==1}thens(n+1)=1
(2)if{s(n)==1 and s(n-1)!=1 and s(n+1)!=1}thens(n)=s(n-1)
9.一种基于长时特性的音频事件检测装置,所述装置包括:
音频流分段部分,用于将输入音频流分成一系列的小段;
特征提取部分,用于对每个段提取短时和长时特征;并且
分类部分,用于根据所提取的短时和长时特征,得到关于音频流的分类结果。
10.如权利要求9所述的音频事件检测装置,还包括平滑部分,用于经过平滑处理得到事件检测结果。
11.如权利要求9所述的音频事件检测装置,其中,在提取短时和长时特征之后,采用降维算法对MSV特征矢量进行降维,以去除特征的冗余信息。
12.如权利要求9所述的音频事件检测装置,其中,所述短时和长时特征是基于段和基于帧之一的。
13.如权利要求9所述的音频事件检测装置,其中,所述分类结果通过支持向量机分类器来进行。
14.如权利要求12所述的音频事件检测装置,其中,基于帧的短时特征至少包括以下特征之一:PLP、LPCC、LFCC、Pitch、短时能量、子带能量分布、亮度和带宽。
15.如权利要求12所述的音频事件检测装置,其中,基于段的长时特征至少包括以下特征之一:谱通量、长时平均谱和LPC熵。
16.如权利要求10所述的音频事件检测装置,其中,平滑部分的平滑处理中所使用的平滑规则如下:
(1)if{s(n)==1 and s(n+1)!=1 and s(n+2)==1}thens(n+1)=1
(2)if{s(n)==1 and s(n-1)!=1 and s(n+1)!=1}thens(n)=s(n-1)
17.一种用于在计算机上实现基于长时特性的音频事件检测方法的计算机产品,所述方法包括如下步骤:
将输入音频流分成一系列的小段;
对每个段提取短时和长时特征;
并且根据所提取的短时和长时特征,得到关于音频流的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司;中国科学院声学研究所,未经索尼公司;中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010590438.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:绕线转子绕组端部连接片
- 下一篇:采用内藏磁钢不均匀气隙结构的永磁转子