[发明专利]基于Teager能量熵的音符切分方法有效
申请号: | 201110063242.1 | 申请日: | 2011-03-16 |
公开(公告)号: | CN102129858A | 公开(公告)日: | 2011-07-20 |
发明(设计)人: | 李锵;冯亚楠;关欣 | 申请(专利权)人: | 天津大学 |
主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L19/14;G10H7/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘国威 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及音频信号处理。为克服现有技术的不足,将音频信号中的各个音符准确、快速检测出来,本发明采用的技术方案是,基于Teager能量熵的音符切分方法,包括下列步骤:1.预处理采用一阶FIR数字滤波器,系数取0.9375,实现预加重,选用汉明窗进行加窗,采用可移动的有限窗口进行加权的方法实现分帧,使帧间有交叠,以保证连续音乐信号流的自相关性和过渡信息的提取;2.特征提取提取Teager能量熵,即统计Teager能量的信息熵H;3.后处理:4.峰值提取:采用双门限阈值法进行峰值提取。本发明主要应用于音频信号处理。 | ||
搜索关键词: | 基于 teager 能量 音符 切分 方法 | ||
【主权项】:
一种基于Teager能量熵的音符切分方法,其特征是,具体包括下列步骤:1.预处理采用一阶FIR数字滤波器,系数取0.9375,实现预加重,选用汉明窗进行加窗,采用可移动的有限窗口进行加权的方法实现分帧,使帧间有交叠,以保证连续音乐信号流的自相关性和过渡信息的提取;2.特征提取提取Teager能量熵,即统计Teager能量的信息熵H;3.后处理H1=C*H/max(H) (1)H2=‑H1*log10(H1+eps) (2)式(1)中H为初步特征提取得到的Teager能量熵,H1和H2为分两步进行后处理后所得到的Teager能量熵,eps是为了避免对0取对数而加入的一个极小值,C为经验值,当波峰极大值与极小值相差大时,C取较大,具体依据两极值间比例而定;当极大值与极小值相差小或者有噪声污染时,C取较小(C<1),以防噪声被放大,最后再用移动窗进行曲线平滑;4.峰值提取采用双门限阈值法进行峰值提取:首先计算音乐流前数帧数据的Teager能量熵,并取平均值(记为N)作为背景噪声估计,双门限阈值分别为:M1=αN,M2=βN,其中α,β为经验值且α<β,即M1<M2。对于式(2)所得第i帧Teager能量熵H2(i),如果满足H2(i‑1)<M1,H2(i)≥M1,即由背景噪声上升为过渡阶段,且接下来的连续3~5帧都大于M2,则第i帧标记为音符起始帧。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110063242.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种电容器落料机
- 下一篇:一种智能公交显示站牌