[发明专利]一种基于整形小波变换的音频无损压缩编码、解码方法有效

申请号：	201010281033.X	申请日：	2010-09-14
公开（公告）号：	CN101944362A	公开（公告）日：	2011-01-12
发明（设计）人：	吴玺宏;曲天书;迟惠生;高懿;何文欣;张搏	申请（专利权）人：	北京大学
主分类号：	G10L19/00	分类号：	G10L19/00;G10L19/04
代理公司：	北京君尚知识产权代理事务所(普通合伙) 11200	代理人：	余功勋
地址：	100871 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于整形变换音频无损压缩编码解码方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于信源编、解码领域，具体涉及一种音频无损压缩编码、解码方法。

背景技术

随着数字时代的到来，音频信号的数字化给人们带来诸多方便的同时生成了海量的音频数据，这给音频信号的存储和传输带来了很大的挑战，成为了阻碍人们获得和使用多媒体信息的瓶颈问题之一。为了解决这个问题，就必须对音频数据进行压缩，以压缩编码的方式对数据进行存储和传输。事实证明，对多媒体的数据进行压缩是必要和可行的，因为声音和图像等多媒体数据信息中有较强的冗余信息，即数据之间有较强的相关性，可通过去掉冗余信息(即去除数据间的相关性)、保留有用的音频信息来实现压缩。因此，研究和开发高效的音频编码方法，以压缩的形式存储和传输音频信息是必然的选择。而且随着人们对音频质量要求的提高，如何在保留全部音频信息的条件下，以尽可能大的压缩比压缩音频数据，从而给人们提供真正透明的音质，成为当前音频压缩编码所面临的主要课题。

早在20世纪70年代，英国、日本等广播部门就开始研究数字音频有损压缩编码，目前的有损音频压缩编码标准经过四十年的发展，出现了很多优秀的编码标准，其中有代表性的有MP3、AAC、WMA等，这些编码格式在很多情况下都可以达到较好的主观音质和很高的压缩比，但是当它们遇到频率动态范围较大的音乐，例如大型交响乐等，这些有损音频编码后的音质表现就显得差强人意。另外在音频编辑领域中，对有损压缩编码的音频数据做二次编码(即两种有损编码格式之间的转换)会丢失更多的信息，从而引入更大的失真。为了解决上述的问题，满足一些对音质要求比较高的需要，就必然要使用无损压缩编码。

目前针对音频信号进行无损压缩编码的研究与应用相比较有损压缩编码而言却并不多见。无损压缩未能得到足够关注的原因是其压缩比很难超过3∶1，而有损算法压缩比能达到12∶1甚至更高。但是对有损压缩算法来说，压缩比越高，最终获得的音频质量越差，一旦确定最低可能的数据率，有损压缩算法是唯一选择。然而，音乐爱好者想从网上下载高保真立体声音频信号以便获得最佳的音乐效果，因此，网上音乐推广将提供更高压缩比的音频信号，以便于不同消费者浏览和选择，而酷爱CD级音频质量的音乐爱好者希望获得原始音频信号的无损压缩拷贝——该备份不因压缩算法的差异而有任何信号损失。除了可供网上音频信号下载外，无损音频压缩编码还可应用于专业环境下高保真音频数据的归档、混音、演播室、节目制作等。在这种情况下，无损压缩避免了使用有损压缩编码情况下因多次编辑而引起的信号损失。

从信息论观点来看，音频信号作为一个信源，描述信源的数据是信息量(信息熵)和信息冗余量之和。几乎所有的无损音频压缩都基于相似的思想，首先从信号中去除冗余，去除的只是数据中的冗余量，而没有减少信源中的信息量。然后用有效的数据编码方案进行编码。音频信号中的存在着多种冗余，主要有信号幅度分布的非均匀性，相邻样值之间的相关性，周期之间的相关性等。所以无损压缩编码算法的主要思想就是如何有效的去处音频信号中的冗余。目前比较知名的音频无损编码算法的格式有FLAC(Free Lossless Audio Codec)、WavPack、TAK(Tom′s Audio Kompressor)、APE(Monkey′s Audio)、OFR(OptimFROG)、ALAC(Apple Lossless Audio Codec)、WMAL(Windows Media Audio Lossless)、Shorten、LA(LosslessAudio)、TTA(Ture Audio)、LPAC(Lossless Predictive Audio Coder)、RAL(RealAudioLossless)、MPEG-ALS等。这些算法主要利用两种方法来进行去相关从而进一步进行无损压缩编码：一种是基于时域线性预测编码(LPC)的技术，另一种是基于变换域的技术例如IntMDCT(Integer Modified Discrete Cosnie Transform，整数改进型离散余弦变换)。无损压缩的目标是除去数据中的冗余(redundancy)，完美重构原始音频信号。线性预测编码可以进一步减少冗余，对于那些具有平稳特性的信号特别有效。一般来讲，平稳的声音信号信息冗余较大，而一个不协调(类似噪音)的信号信息冗余较小。一个特定取样值的大小与其邻近的取样值有关，一般而言，当前取样值与其上一个取样值较为接近。对低频信号，更是如此。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京大学，未经北京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201010281033.X/2.html，转载请声明来源钻瓜专利网。

上一篇：一台炉多台中速磨的石子煤自动回收处理装置
下一篇：一种面向特定人群的语音识别方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于整形小波变换的音频无损压缩编码、解码方法有效

专利文献下载