[发明专利]一种基于整形小波变换的音频无损压缩编码、解码方法有效
申请号: | 201010281033.X | 申请日: | 2010-09-14 |
公开(公告)号: | CN101944362A | 公开(公告)日: | 2011-01-12 |
发明(设计)人: | 吴玺宏;曲天书;迟惠生;高懿;何文欣;张搏 | 申请(专利权)人: | 北京大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/04 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余功勋 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 整形 变换 音频 无损 压缩 编码 解码 方法 | ||
技术领域
本发明属于信源编、解码领域,具体涉及一种音频无损压缩编码、解码方法。
背景技术
随着数字时代的到来,音频信号的数字化给人们带来诸多方便的同时生成了海量的音频数据,这给音频信号的存储和传输带来了很大的挑战,成为了阻碍人们获得和使用多媒体信息的瓶颈问题之一。为了解决这个问题,就必须对音频数据进行压缩,以压缩编码的方式对数据进行存储和传输。事实证明,对多媒体的数据进行压缩是必要和可行的,因为声音和图像等多媒体数据信息中有较强的冗余信息,即数据之间有较强的相关性,可通过去掉冗余信息(即去除数据间的相关性)、保留有用的音频信息来实现压缩。因此,研究和开发高效的音频编码方法,以压缩的形式存储和传输音频信息是必然的选择。而且随着人们对音频质量要求的提高,如何在保留全部音频信息的条件下,以尽可能大的压缩比压缩音频数据,从而给人们提供真正透明的音质,成为当前音频压缩编码所面临的主要课题。
早在20世纪70年代,英国、日本等广播部门就开始研究数字音频有损压缩编码,目前的有损音频压缩编码标准经过四十年的发展,出现了很多优秀的编码标准,其中有代表性的有MP3、AAC、WMA等,这些编码格式在很多情况下都可以达到较好的主观音质和很高的压缩比,但是当它们遇到频率动态范围较大的音乐,例如大型交响乐等,这些有损音频编码后的音质表现就显得差强人意。另外在音频编辑领域中,对有损压缩编码的音频数据做二次编码(即两种有损编码格式之间的转换)会丢失更多的信息,从而引入更大的失真。为了解决上述的问题,满足一些对音质要求比较高的需要,就必然要使用无损压缩编码。
目前针对音频信号进行无损压缩编码的研究与应用相比较有损压缩编码而言却并不多见。无损压缩未能得到足够关注的原因是其压缩比很难超过3∶1,而有损算法压缩比能达到12∶1甚至更高。但是对有损压缩算法来说,压缩比越高,最终获得的音频质量越差,一旦确定最低可能的数据率,有损压缩算法是唯一选择。然而,音乐爱好者想从网上下载高保真立体声音频信号以便获得最佳的音乐效果,因此,网上音乐推广将提供更高压缩比的音频信号,以便于不同消费者浏览和选择,而酷爱CD级音频质量的音乐爱好者希望获得原始音频信号的无损压缩拷贝——该备份不因压缩算法的差异而有任何信号损失。除了可供网上音频信号下载外,无损音频压缩编码还可应用于专业环境下高保真音频数据的归档、混音、演播室、节目制作等。在这种情况下,无损压缩避免了使用有损压缩编码情况下因多次编辑而引起的信号损失。
从信息论观点来看,音频信号作为一个信源,描述信源的数据是信息量(信息熵)和信息冗余量之和。几乎所有的无损音频压缩都基于相似的思想,首先从信号中去除冗余,去除的只是数据中的冗余量,而没有减少信源中的信息量。然后用有效的数据编码方案进行编码。音频信号中的存在着多种冗余,主要有信号幅度分布的非均匀性,相邻样值之间的相关性,周期之间的相关性等。所以无损压缩编码算法的主要思想就是如何有效的去处音频信号中的冗余。目前比较知名的音频无损编码算法的格式有FLAC(Free Lossless Audio Codec)、WavPack、TAK(Tom′s Audio Kompressor)、APE(Monkey′s Audio)、OFR(OptimFROG)、ALAC(Apple Lossless Audio Codec)、WMAL(Windows Media Audio Lossless)、Shorten、LA(LosslessAudio)、TTA(Ture Audio)、LPAC(Lossless Predictive Audio Coder)、RAL(RealAudioLossless)、MPEG-ALS等。这些算法主要利用两种方法来进行去相关从而进一步进行无损压缩编码:一种是基于时域线性预测编码(LPC)的技术,另一种是基于变换域的技术例如IntMDCT(Integer Modified Discrete Cosnie Transform,整数改进型离散余弦变换)。无损压缩的目标是除去数据中的冗余(redundancy),完美重构原始音频信号。线性预测编码可以进一步减少冗余,对于那些具有平稳特性的信号特别有效。一般来讲,平稳的声音信号信息冗余较大,而一个不协调(类似噪音)的信号信息冗余较小。一个特定取样值的大小与其邻近的取样值有关,一般而言,当前取样值与其上一个取样值较为接近。对低频信号,更是如此。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010281033.X/2.html,转载请声明来源钻瓜专利网。