[发明专利]一种基于音频片段切分的数字音频时域压缩方法有效
申请号: | 201010570222.9 | 申请日: | 2010-11-26 |
公开(公告)号: | CN102063919A | 公开(公告)日: | 2011-05-18 |
发明(设计)人: | 王朝坤;王建民;刘璋 | 申请(专利权)人: | 清华大学 |
主分类号: | G11B20/14 | 分类号: | G11B20/14 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗文群 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于音频片段切分的数字音频时域压缩方法,属于音频处理技术领域。本方法通过提取乐曲的数字音频中的音频特征,分析并获得乐曲的结构信息,根据乐曲的结构信息选择并删除若干个可删除音频片段序列,最后使用数字音频时域压缩方法对删除后的数字音频进行时域压缩,从而改变乐曲的播放时间长度。本发明方法在数字音频时域压缩前,根据乐曲的结构信息找到满足特定条件的音频片段子序列,删除音频片段子序列后,可以保证乐曲中剩下的音频片段自然、平滑地连接,减少了数字音频时域压缩对数字音频播放质量的影响,改善了时域压缩后的数字音频的播放效果。 | ||
搜索关键词: | 一种 基于 音频 片段 切分 数字音频 时域 压缩 方法 | ||
【主权项】:
1.一种基于音频片段切分的数字音频时域压缩方法,其特征在于该方法包括以下步骤:(1)将原始乐曲数字音频分为n个音频片段,得到一个音频片段序列,记为:s1、s2、s3、......、sn-1、sn,设音频片段si的原始时间长度为ti;(2)根据用户设定的压缩后的乐曲数字音频的时间长度Tu和压缩过程中的乐曲数字音频的当前时间长度Tm,得到时域压缩率(3)对上述时域压缩率p进行判断,若p小于或者等于用户设定的最小压缩率pmin,则转至步骤(4),若时域压缩率p大于用户设定的最小压缩率pmin,则转至步骤(8);(4)对上述n个音频片段中的任意两个音频片段si、sj,使用音频片段相似度量方法计算音频片段si与音频片段sj之间的相似度值di,j,对相似度值di,j进行判断,若相似度值di,j大于或者等于设定的相似度阈值I,则判断音频片段si与音频片段sj为相似音频片段,若相似度值di,j小于设定的相似度阈值I,则判断音频片段si与音频片段sj为不相似音频片段,重复该步骤,遍历n个音频片段中的任意两个音频片段,得到所有任意两个音频片段之间的相似关系,相似度阈值I为从正无穷到负无穷的实数;(5)根据上述音频片段之间的相似关系,将n个音频片段分为w个音频片段组,记为:G1、G2、...、Gx、...、Gw,满足音频片段组Gx中的任意一个音频片段si,在Gx中至少存在一个与音频片段si相似的音频片段sj,且在音频片段组Gx以外的音频片段组中不存在与音频片段si相似的音频片段;(6)为每个音频片段组Gi设置一个唯一的音频片段组标识符Ai,用一个音频片段组标识符Ai对音频片段组Gi中的所有音频片段进行标记;用音频片段组标识符Ai表达上述音频片段序列s1、s2、s3、......、sn-1、sn,得到与乐曲的音频片段序列相对应的音频片段组标识符序列;形成一个可删除子序列sb、sb+1、......、se-1、se,该可删除子序列满足:在音频片段标识符序列中存在两个相邻的音频片段标识符,该两个音频片段标识符分别与音频片段sb-1和音频片段组标识符与se+1相对应,其中,b和e为正整数,1<b≤e<n;遍历音频片段组标识符序列,得到所有可删除子序列;(7)从上述音频片段序列中删除一个可删除子序列,使删除可删除子序列后的乐曲数字音频的时间长度Tc与用户设定的压缩后的乐曲数字音频的时间长度Tu之间的差值的绝对值最小,转至步骤(2);(8)根据步骤(2)得到时域压缩率p,使用数字音频时域压缩方法对上述数字音频文件进行时域压缩。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010570222.9/,转载请声明来源钻瓜专利网。