[发明专利]一种基于音频片段切分的数字音频时域压缩方法有效
申请号: | 201010570222.9 | 申请日: | 2010-11-26 |
公开(公告)号: | CN102063919A | 公开(公告)日: | 2011-05-18 |
发明(设计)人: | 王朝坤;王建民;刘璋 | 申请(专利权)人: | 清华大学 |
主分类号: | G11B20/14 | 分类号: | G11B20/14 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗文群 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 音频 片段 切分 数字音频 时域 压缩 方法 | ||
技术领域
本发明涉及一种基于音频片段切分的数字音频时域压缩方法,属于音频处理技术领域。
背景技术
随着互联网和多媒体技术的发展,音乐已经成为人们日常生活中不可或缺的娱乐形式。当选用一首乐曲作为背景音乐的时候,通常会发生所选乐曲的播放时间长度与所需要的播放时间长度不相符的情况。此时,需要压缩和调整乐曲的内容,同时保证乐曲的播放效果。现有的数字音频时域压缩方法可以分为均匀数字音频时域压缩方法和非均匀数字音频时域压缩方法,如名称为“一种基于歌词的数字音频时域压缩方法”、申请号为CN200910235724.3、公开号为CN101702321A的发明专利,上述两类数字音频时域压缩方法在处理用户所要求的播放时间长度与乐曲的原始时间长度相差较大的情况时,会导致乐曲的播放速率过快、声音抖动等问题,无法达到理想的时域压缩效果。
发明内容
本发明的目的是提出一种基于音频片段切分的数字音频时域压缩方法,通过提取乐曲的数字音频中的音频特征,分析并获得乐曲的结构信息,根据乐曲的结构信息选择并删除若干个可删除音频片段序列,最后使用数字音频时域压缩方法对删除后的数字音频进行时域压缩,从而改变乐曲的播放时间长度。
本发明提出的基于音频片段切分的数字音频时域压缩方法,包括以下步骤:
(1)将原始乐曲数字音频分为n个音频片段,得到一个音频片段序列,记为:s1、s2、s3、......、sn-1、sn,设音频片段si的原始时间长度为ti;
(2)根据用户设定的压缩后的乐曲数字音频的时间长度Tu和压缩过程中的乐曲数字音频的当前时间长度Tm,得到时域压缩率
(3)对上述时域压缩率p进行判断,若p小于或者等于用户设定的最小压缩率pmin,则转至步骤(4),若时域压缩率p大于用户设定的最小压缩率pmin,则转至步骤(8);
(4)对上述n个音频片段中的任意两个音频片段si、sj,使用音频片段相似度量方法计算音频片段si与音频片段sj之间的相似度值di,j,对相似度值di,j进行判断,若相似度值di,j大于或者等于设定的相似度阈值I,则判断音频片段si与音频片段sj为相似音频片段,若相似度值di,j小于设定的相似度阈值I,则判断音频片段si与音频片段sj为不相似音频片段,重复该步骤,遍历n个音频片段中的任意两个音频片段,得到所有任意两个音频片段之间的相似关系,相似度阈值I为从正无穷到负无穷的实数;
(5)根据上述音频片段之间的相似关系,将n个音频片段分为w个音频片段组,记为:G1、G2、...、Gx、...、Gw,满足音频片段组Gx中的任意一个音频片段si,在Gx中至少存在一个与音频片段si相似的音频片段sj,且在音频片段组Gx以外的音频片段组中不存在与音频片段si相似的音频片段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010570222.9/2.html,转载请声明来源钻瓜专利网。