[发明专利]一种基于音乐特征的数字音频时域压缩方法有效

申请号：	201010570241.1	申请日：	2010-11-26
公开（公告）号：	CN102034514A	公开（公告）日：	2011-04-27
发明（设计）人：	王朝坤;王建民;刘璋	申请（专利权）人：	清华大学
主分类号：	G11B20/14	分类号：	G11B20/14
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	罗文群
地址：	100084***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于音乐特征数字音频时域压缩方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种基于音乐特征的数字音频时域压缩方法，属于音频处理技术领域。

背景技术

在数字音频处理中，经常遇到数字音频的时间长度与应用环境的时间长度要求不相符的情况。例如：使用一段时间长度为330秒的乐曲作为一段时间长度为280秒的视频片段的配乐。为了使数字音频的时间长度满足应用环境的时间长度要求，需要使用数字音频时域压缩方法对数字音频进行时域压缩。在进行时域压缩后，需要保证数字音频的播放质量可以满足用户的欣赏需求。

现有的数字音频时域压缩方法存在如下不足：均匀数字音频时域压缩方法对乐曲中各个音频片段按照相同的时域压缩率进行时域压缩，因此对于乐曲中压缩抗性值较低的片段，会产生乐曲速度过快、声音抖动等现象，影响时域压缩后乐曲的播放质量。而现有的非均匀数字音频时域压缩方法，如名称为“一种基于歌词的数字音频时域压缩方法”、申请号为CN200910235724.3、公开号为CN101702321A的发明专利，只能基于歌词处理乐曲，无法处理没有歌词的乐曲。同时，该方法仅利用歌词密度信息估计各音频片段的压缩抗性，无法获得一个歌词句子内部的压缩抗性信息。

发明内容

本发明的目的是提出一种基于音乐特征的数字音频时域压缩方法，通过提取乐曲的音频特征和歌词特征，分析并获得乐曲中各音频片段的压缩抗性值，然后根据各音频片段的压缩抗性值对乐曲的数字音频中各音频片段进行不同程度的时域压缩，从而改变一首乐曲的播放时间。

本发明提出的基于音乐特征的数字音频时域压缩方法，包括以下步骤：

(1)根据用户设定的压缩后的乐曲数字音频的时间长度T_u和原始乐曲数字音频的时间长度T_m，得到时域压缩率并得到压缩后的总时间减少量D＝T_m-T_u，根据用户设定，将压缩后的总时间减少量D平分为k份长度相等的时间片

(2)将原始乐曲数字音频分为n个音频片段，分别记为：s₁、_s2、s₃、......、s_n-1、s_n，设第s_i个音频片段的原始时间长度为t_i，设第s_i个音频片段的压缩过程中的当前时间长度为c_i，使n个音频片段的当前时间长度c_i的值等于音频片段s_i的原始时间长度t_i；

(3)使用音乐特征提取方法，分别从n个音频片段的每个音频片段s_i中提取一个v维的音乐特征向量F_i＝(f_i，1，f_i，2，......，f_i，v-1，f_i，v)，其中f_i，j为第s_i个音频片段的第j个音乐特征值，其中j的取值范围为1到v的整数；

(4)根据上述音乐特征向量F_i，计算第s_i个音频片段的压缩抗性值R_i，R_i＝其中w₁、w₂、......、w_v、w_v-1为权重系数，w₁、w₂、......、w_v、w_v-1的取值满足重复该步骤，分别得到n个音频片段的压缩抗性值R₁、R₂、......、R_n-1、R_n；

(5)将n个音频片段按照上述压缩抗性值从大到小排序，得到音频片段队列q；

(6)从上述音频片段队列q中取出压缩抗性值最大的第s_e个音频片段，将第s_e个音频片段的当前时间长度c_e更新为c_e-T，重复上述步骤(4)，重新计算第s_e个音频片段的压缩抗性R_e，并使上述总时间减少量D更新为D-T，若D＞0，则转至步骤(5)，若D≤0，则转至步骤(7)；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201010570241.1/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G11 信息存储
G11B 基于记录载体和换能器之间的相对运动而实现的信息存储
G11B20-00 并非专指记录或重现方法的信号处理；为此所用的电路
G11B20-02 .模拟量的记录或重现
G11B20-10 .数字记录或重现
G11B20-20 .用于给多轨迹记录校正歪斜的
G11B20-22 .用于减小失真的
G11B20-24 .用于降低噪音的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于音乐特征的数字音频时域压缩方法有效

专利文献下载