[发明专利]一种基于音频片段切分的数字音频时域压缩方法有效

申请号：	201010570222.9	申请日：	2010-11-26
公开（公告）号：	CN102063919A	公开（公告）日：	2011-05-18
发明（设计）人：	王朝坤;王建民;刘璋	申请（专利权）人：	清华大学
主分类号：	G11B20/14	分类号：	G11B20/14
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	罗文群
地址：	100084***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于音频片段切分的数字音频时域压缩方法，属于音频处理技术领域。本方法通过提取乐曲的数字音频中的音频特征，分析并获得乐曲的结构信息，根据乐曲的结构信息选择并删除若干个可删除音频片段序列，最后使用数字音频时域压缩方法对删除后的数字音频进行时域压缩，从而改变乐曲的播放时间长度。本发明方法在数字音频时域压缩前，根据乐曲的结构信息找到满足特定条件的音频片段子序列，删除音频片段子序列后，可以保证乐曲中剩下的音频片段自然、平滑地连接，减少了数字音频时域压缩对数字音频播放质量的影响，改善了时域压缩后的数字音频的播放效果。
搜索关键词：	一种基于音频片段切分数字音频时域压缩方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于音频片段切分的数字音频时域压缩方法，其特征在于该方法包括以下步骤：(1)将原始乐曲数字音频分为n个音频片段，得到一个音频片段序列，记为：s₁、s₂、s₃、......、s_n-1、s_n，设音频片段s_i的原始时间长度为t_i；(2)根据用户设定的压缩后的乐曲数字音频的时间长度T_u和压缩过程中的乐曲数字音频的当前时间长度T_m，得到时域压缩率(3)对上述时域压缩率p进行判断，若p小于或者等于用户设定的最小压缩率p_min，则转至步骤(4)，若时域压缩率p大于用户设定的最小压缩率p_min，则转至步骤(8)；(4)对上述n个音频片段中的任意两个音频片段s_i、s_j，使用音频片段相似度量方法计算音频片段s_i与音频片段s_j之间的相似度值d_i，j，对相似度值d_i，j进行判断，若相似度值d_i，j大于或者等于设定的相似度阈值I，则判断音频片段s_i与音频片段s_j为相似音频片段，若相似度值d_i，j小于设定的相似度阈值I，则判断音频片段s_i与音频片段s_j为不相似音频片段，重复该步骤，遍历n个音频片段中的任意两个音频片段，得到所有任意两个音频片段之间的相似关系，相似度阈值I为从正无穷到负无穷的实数；(5)根据上述音频片段之间的相似关系，将n个音频片段分为w个音频片段组，记为：G₁、G₂、...、G_x、...、G_w，满足音频片段组G_x中的任意一个音频片段s_i，在G_x中至少存在一个与音频片段s_i相似的音频片段s_j，且在音频片段组G_x以外的音频片段组中不存在与音频片段s_i相似的音频片段；(6)为每个音频片段组G_i设置一个唯一的音频片段组标识符A_i，用一个音频片段组标识符A_i对音频片段组G_i中的所有音频片段进行标记；用音频片段组标识符A_i表达上述音频片段序列s₁、s₂、s₃、......、s_n-1、s_n，得到与乐曲的音频片段序列相对应的音频片段组标识符序列；形成一个可删除子序列s_b、s_b+1、......、s_e-1、s_e，该可删除子序列满足：在音频片段标识符序列中存在两个相邻的音频片段标识符，该两个音频片段标识符分别与音频片段s_b-1和音频片段组标识符与s_e+1相对应，其中，b和e为正整数，1＜b≤e＜n；遍历音频片段组标识符序列，得到所有可删除子序列；(7)从上述音频片段序列中删除一个可删除子序列，使删除可删除子序列后的乐曲数字音频的时间长度T_c与用户设定的压缩后的乐曲数字音频的时间长度T_u之间的差值的绝对值最小，转至步骤(2)；(8)根据步骤(2)得到时域压缩率p，使用数字音频时域压缩方法对上述数字音频文件进行时域压缩。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201010570222.9/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G11 信息存储
G11B 基于记录载体和换能器之间的相对运动而实现的信息存储
G11B20-00 并非专指记录或重现方法的信号处理；为此所用的电路
G11B20-02 .模拟量的记录或重现
G11B20-10 .数字记录或重现
G11B20-20 .用于给多轨迹记录校正歪斜的
G11B20-22 .用于减小失真的
G11B20-24 .用于降低噪音的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于音频片段切分的数字音频时域压缩方法有效

专利文献下载