[发明专利]音频信号分析有效
申请号: | 201280075416.9 | 申请日: | 2012-06-29 |
公开(公告)号: | CN104620313B | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | A·J·埃罗宁 | 申请(专利权)人: | 诺基亚技术有限公司 |
主分类号: | G10H1/40 | 分类号: | G10H1/40;G10L99/00 |
代理公司: | 北京市中咨律师事务所11247 | 代理人: | 刘薇,杨晓光 |
地址: | 芬兰*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 分析 | ||
1.一种用于音频信号分析的装置,其被配置为:
第一重音信号模块,用于生成表示音频信号中的音乐重音的第一重音信号(a1);
速度估计器,其被配置为使用所述第一重音信号(a1)来生成所述音频信号的估计速度(BPMest);
第二重音信号模块,用于生成表示所述音频信号中的音乐重音的不同的第二重音信号(a2);
第一节拍跟踪模块,用于根据所述第一重音信号(a1)和所述估计速度(BPMest)来估计第一节拍时间序列(b1);
用于对所述估计速度(BPMest)执行向上取整函数和向下取整函数以分别生成向上取整的速度估计(ceil(BPMest))和向下取整的速度估计(floor(BPMest))的装置,其中,第二节拍跟踪模块被配置为使用所述第二重音信号(a2)和所述向上取整的速度估计来生成第二节拍时间序列(b2),并使用所述第二重音信号(a2)和所述向下取整的速度估计来生成第三节拍时间序列(b3);以及
序列选择器,用于识别所述第一节拍时间序列(b1)、所述第二节拍时间序列(b2)和所述第三节拍时间序列(b3)中的哪一个与所述重音信号的一个或两者中的峰值最接近一致。
2.根据权利要求1所述的装置,其中,所述第一重音信号模块被配置为通过基于基频(f0)突出度分析来提取色度重音特征,生成所述第一重音信号(a1)。
3.根据权利要求1所述的装置,其中,所述第二重音信号模块被配置为使用所述音频信号的带宽的预定子带来生成所述第二重音信号(a2)。
4.根据权利要求3所述的装置,其中,所述第二重音信号模块被配置为使用低于200Hz的预定子带来生成所述第二重音信号(a2)。
5.根据权利要求3所述的装置,其中,所述第二重音信号模块被配置为通过执行所述音频信号的多速率滤波器组分解以及使用来自预定的一个滤波器的输出来生成所述重音信号,生成所述第二重音信号(a2)。
6.根据权利要求1所述的装置,其中,所述第二节拍跟踪模块被配置为对于所述向上取整的速度估计和所述向下取整的速度估计中的每一个,使用所述估计来生成初始节拍时间序列(bt),将其与基准节拍时间序列(bi)进行比较,以及使用预定的相似度算法生成所述第二节拍时间序列和所述第三节拍时间序列。
7.根据权利要求6所述的装置,其中,由所述第二节拍跟踪模块使用的所述预定的相似度算法包括在偏移位置的范围上比较所述初始节拍时间序列(bt)和所述基准节拍时间序列(bi)以识别所述范围内的最佳匹配,所生成的第二/第三节拍时间序列包括导致所述最佳匹配的所述基准节拍时间序列(bi)的偏移版本。
8.根据权利要求6或7所述的装置,其中,所述基准节拍时间序列(bi)具有恒定的节拍间隔。
9.根据权利要求8所述的装置,其中,所述基准节拍时间序列(bi)在t=0,1/(X/60),2/(X/60)......n/(X/60)时生成,其中,X是所述估计速度的整数表示,n是整数。
10.根据权利要求7所述的装置,其中,在所述算法中使用的所述偏移位置的范围在0到1.1/(X/60)之间,其中,X是所述估计速度的整数表示。
11.根据权利要求7所述的装置,其中,在所述算法中用于比较的所述偏移位置具有0.1/(BPMest/60)的步长。
12.根据权利要求1所述的装置,其中,所述序列选择器被配置为识别所述节拍时间序列中的哪一个与所述第二重音信号中的峰值最接近一致。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚技术有限公司,未经诺基亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280075416.9/1.html,转载请声明来源钻瓜专利网。