[发明专利]基于Teager能量熵的音符切分方法有效

专利信息
申请号: 201110063242.1 申请日: 2011-03-16
公开(公告)号: CN102129858A 公开(公告)日: 2011-07-20
发明(设计)人: 李锵;冯亚楠;关欣 申请(专利权)人: 天津大学
主分类号: G10L11/00 分类号: G10L11/00;G10L19/14;G10H7/08
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 刘国威
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 teager 能量 音符 切分 方法
【说明书】:

技术领域

发明涉及音频信号处理,具体讲涉及基于Teager能量熵(Teager Energy Entropy,TEE)的音符切分方法。

背景技术

随着现代信息技术,特别是多媒体技术和网络技术的迅猛发展,多媒体信息的数据量急剧增多,如何在浩如烟海的数据库中快速准确地挑选出有用的信息变得尤为重要。同时在现有的信息检索技术下,音频信号、音乐领域也面临着同样的难题。而基于内容音乐检索的研究在极大程度上缓解了这一尴尬。作为音乐基本单位的音符,包含了极具细节性和有效性的信息,如何高效准确地切分出完整音符已经成为基于内容的音乐检索中必不可少的关键性步骤。如哼唱检索(QBH,Query By Humming)系统,一套完整的音符切分程序,不仅极大地方便用户进行自然哼唱,免除须爆破音哼唱的限制,而且有效地提升了检索精度,加快了检索效率。此外,在基于内容的音频流切分与聚类,歌曲有歌唱部分检测,音乐标签及当下热门的音乐“指纹”识别等多种音乐处理中,音符切分都是不可或缺的重要环节,其准确性关乎整个系统的性能。

传统上主要提取时域特征来实现音符切分,如提取短时能量和过零率,这些方法简单易行,但只对能量变化鲜明的打击类音乐(如鼓声)效果较佳。近年来,随着音乐检索领域相关理论的迅猛发展,出现了多种音符切分法,这些方法主要针对不同类型的音乐信号提取各种新的特征参数,如频域中基于相位和谱能的方法,复域中谱差分法,小波域方法及统计学方法,但这些方法往往只对有调性明显的音乐性能较好,且计算量和复杂度都较大。

相对而言,自适应子带谱熵法(Adaptive Sub-band Spectral Entropy,ASSE)同时包含子带谱熵和能量信息,通用性和鲁棒性更强。但是当音频文件包含多种演奏乐器或加有背景音乐时,音符切分效果便会下降。此外,由于只注重能量信息,ASSE容易漏检能量较低的音符,而且无法准确切分相临近音符的边界,同时提取频域特征计算量较大。

发明内容

为克服现有技术的不足,将音频信号中的各个音符准确、快速检测出来,本发明采用的技术方案是,基于Teager能量熵的音符切分方法,包括下列步骤:

1.预处理

采用一阶FIR数字滤波器,系数取0.9375,实现预加重,选用汉明窗进行加窗,采用可移动的有限窗口进行加权的方法实现分帧,使帧间有交叠,以保证连续音乐信号流的自相关性和过渡信息的提取;

2.特征提取

提取Teager能量熵,即统计Teager能量的信息熵H;

3.后处理

H1=C*H/max(H)    (1)

H2=-H1*log10(H1+eps)    (2)

式(1)中H为初步特征提取得到的Teager能量熵,H1和H2为分两步进行后处理后所得到的Teager能量熵,eps是为了避免对0取对数而加入的一个极小值,C为经验值,当波峰极大值与极小值相差大时,C取较大,具体依据两极值间比例而定;当极大值与极小值相差小或者有噪声污染时,C取较小(C<1),以防噪声被放大,最后再用移动窗进行曲线平滑;

4.峰值提取

采用双门限阈值法进行峰值提取:首先计算音乐流前数帧数据的Teager能量熵,并取平均值(记为N)作为背景噪声估计,双门限阈值分别为:M1=αN,M2=βN,其中α,β为经验值且α<β,即M1<M2。对于式(2)所得第i帧Teager能量熵H2(i),如果满足H2(i-1)<M1,H2(i)≥M1,即由背景噪声上升为过渡阶段,且接下来的连续3~5帧都大于M2,则第i帧标记为音符起始帧。

所述提取Teager能量熵,即统计Teager能量的信息熵具体细化为:

核心步骤为运用Shannon信息熵公式:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110063242.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top