[发明专利]一种基于音频片段切分的数字音频时域压缩方法有效

申请号：	201010570222.9	申请日：	2010-11-26
公开（公告）号：	CN102063919A	公开（公告）日：	2011-05-18
发明（设计）人：	王朝坤;王建民;刘璋	申请（专利权）人：	清华大学
主分类号：	G11B20/14	分类号：	G11B20/14
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	罗文群
地址：	100084***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于音频片段切分数字音频时域压缩方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种基于音频片段切分的数字音频时域压缩方法，属于音频处理技术领域。

背景技术

随着互联网和多媒体技术的发展，音乐已经成为人们日常生活中不可或缺的娱乐形式。当选用一首乐曲作为背景音乐的时候，通常会发生所选乐曲的播放时间长度与所需要的播放时间长度不相符的情况。此时，需要压缩和调整乐曲的内容，同时保证乐曲的播放效果。现有的数字音频时域压缩方法可以分为均匀数字音频时域压缩方法和非均匀数字音频时域压缩方法，如名称为“一种基于歌词的数字音频时域压缩方法”、申请号为CN200910235724.3、公开号为CN101702321A的发明专利，上述两类数字音频时域压缩方法在处理用户所要求的播放时间长度与乐曲的原始时间长度相差较大的情况时，会导致乐曲的播放速率过快、声音抖动等问题，无法达到理想的时域压缩效果。

发明内容

本发明的目的是提出一种基于音频片段切分的数字音频时域压缩方法，通过提取乐曲的数字音频中的音频特征，分析并获得乐曲的结构信息，根据乐曲的结构信息选择并删除若干个可删除音频片段序列，最后使用数字音频时域压缩方法对删除后的数字音频进行时域压缩，从而改变乐曲的播放时间长度。

本发明提出的基于音频片段切分的数字音频时域压缩方法，包括以下步骤：

(1)将原始乐曲数字音频分为n个音频片段，得到一个音频片段序列，记为：s₁、s₂、s₃、......、s_n-1、s_n，设音频片段s_i的原始时间长度为t_i；

(2)根据用户设定的压缩后的乐曲数字音频的时间长度T_u和压缩过程中的乐曲数字音频的当前时间长度T_m，得到时域压缩率

(3)对上述时域压缩率p进行判断，若p小于或者等于用户设定的最小压缩率p_min，则转至步骤(4)，若时域压缩率p大于用户设定的最小压缩率p_min，则转至步骤(8)；

(4)对上述n个音频片段中的任意两个音频片段s_i、s_j，使用音频片段相似度量方法计算音频片段s_i与音频片段s_j之间的相似度值d_i，j，对相似度值d_i，j进行判断，若相似度值d_i，j大于或者等于设定的相似度阈值I，则判断音频片段s_i与音频片段s_j为相似音频片段，若相似度值d_i，j小于设定的相似度阈值I，则判断音频片段s_i与音频片段s_j为不相似音频片段，重复该步骤，遍历n个音频片段中的任意两个音频片段，得到所有任意两个音频片段之间的相似关系，相似度阈值I为从正无穷到负无穷的实数；

(5)根据上述音频片段之间的相似关系，将n个音频片段分为w个音频片段组，记为：G₁、G₂、...、G_x、...、G_w，满足音频片段组G_x中的任意一个音频片段s_i，在G_x中至少存在一个与音频片段s_i相似的音频片段s_j，且在音频片段组G_x以外的音频片段组中不存在与音频片段s_i相似的音频片段；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201010570222.9/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G11 信息存储
G11B 基于记录载体和换能器之间的相对运动而实现的信息存储
G11B20-00 并非专指记录或重现方法的信号处理；为此所用的电路
G11B20-02 .模拟量的记录或重现
G11B20-10 .数字记录或重现
G11B20-20 .用于给多轨迹记录校正歪斜的
G11B20-22 .用于减小失真的
G11B20-24 .用于降低噪音的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于音频片段切分的数字音频时域压缩方法有效

专利文献下载