[发明专利]基于Teager能量熵的音符切分方法有效

申请号：	201110063242.1	申请日：	2011-03-16
公开（公告）号：	CN102129858A	公开（公告）日：	2011-07-20
发明（设计）人：	李锵;冯亚楠;关欣	申请（专利权）人：	天津大学
主分类号：	G10L11/00	分类号：	G10L11/00;G10L19/14;G10H7/08
代理公司：	天津市北洋有限责任专利代理事务所 12201	代理人：	刘国威
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及音频信号处理。为克服现有技术的不足，将音频信号中的各个音符准确、快速检测出来，本发明采用的技术方案是，基于Teager能量熵的音符切分方法，包括下列步骤：1.预处理采用一阶FIR数字滤波器，系数取0.9375，实现预加重，选用汉明窗进行加窗，采用可移动的有限窗口进行加权的方法实现分帧，使帧间有交叠，以保证连续音乐信号流的自相关性和过渡信息的提取；2.特征提取提取Teager能量熵，即统计Teager能量的信息熵H；3.后处理：4.峰值提取：采用双门限阈值法进行峰值提取。本发明主要应用于音频信号处理。
搜索关键词：	基于 teager 能量音符切分方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于Teager能量熵的音符切分方法，其特征是，具体包括下列步骤：1.预处理采用一阶FIR数字滤波器，系数取0.9375，实现预加重，选用汉明窗进行加窗，采用可移动的有限窗口进行加权的方法实现分帧，使帧间有交叠，以保证连续音乐信号流的自相关性和过渡信息的提取；2.特征提取提取Teager能量熵，即统计Teager能量的信息熵H；3.后处理H1＝C*H/max(H) (1)H2＝‑H1*log10(H1+eps) (2)式(1)中H为初步特征提取得到的Teager能量熵，H1和H2为分两步进行后处理后所得到的Teager能量熵，eps是为了避免对0取对数而加入的一个极小值，C为经验值，当波峰极大值与极小值相差大时，C取较大，具体依据两极值间比例而定；当极大值与极小值相差小或者有噪声污染时，C取较小(C＜1)，以防噪声被放大，最后再用移动窗进行曲线平滑；4.峰值提取采用双门限阈值法进行峰值提取：首先计算音乐流前数帧数据的Teager能量熵，并取平均值(记为N)作为背景噪声估计，双门限阈值分别为：M1＝αN，M2＝βN，其中α，β为经验值且α＜β，即M1＜M2。对于式(2)所得第i帧Teager能量熵H2(i)，如果满足H2(i‑1)＜M1，H2(i)≥M1，即由背景噪声上升为过渡阶段，且接下来的连续3～5帧都大于M2，则第i帧标记为音符起始帧。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201110063242.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L11-00 不限定于G10L 15/00至G10L 21/00单独一组中的语音或音频特征的测定或检测
G10L11-02 .检测有无语音信号
G10L11-04 .语音信号的音调测定
G10L11-06 .语音信号的浊音和清音之间的鉴别

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于Teager能量熵的音符切分方法有效

专利文献下载