[发明专利]多声道数字音频编码设备及其方法有效
申请号: | 200710105144.3 | 申请日: | 2005-09-07 |
公开(公告)号: | CN101055719A | 公开(公告)日: | 2007-10-17 |
发明(设计)人: | 游余立 | 申请(专利权)人: | 广州广晟数码技术有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/02;H03M7/30 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 刘炳胜 |
地址: | 510640广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多声道 数字音频 编码 设备 及其 方法 | ||
相关申请
本申请要求2004年9月17日申请的美国临时申请60/610,674的优先权。
发明背景
本发明通常涉及用于编码和解码多声道数字音频信号的方法和系统。更确切地说,本发明涉及一个低比特率的数字音频编码系统,其在获得透明的音频信号再现的同时大大降低了多声道音频信号的比特率以便进行有效的发送或存储,甚至连听测专家也不能区分在解码器端还原的音频信号与原始信号。
多声道数字音频编码系统通常包括下列元件:时间-频率分析滤波器组,其产生输入的PCM(脉冲编码调制)样本的一个频率表示、叫做子带样本或子带信号;心理声学模型,其基于人耳的听觉特性来计算一个掩蔽阈值,而低于该掩蔽阈值的量化噪声不太可能被听见;全局比特分配器,其向每组子带样本分配比特资源,以便得到的量化噪声功率低于掩蔽阈值;多个量化器,其根据被分配的比特来量化子带样本;多个熵编码器,其降低量化指数中的统计冗余性;和最后的多路复用器,其把量化指数的熵编码及其它辅助信息打包成一个完整的比特流。
例如,杜比AC-3用可切换窗口尺寸的高频率分辨率的MDCT(改进的离散余弦变换)滤波器组把输入PCM样本映射到频域中。稳态信号用512点的窗口来分析,而暂态信号与256点的窗口来分析。来自MDCT的子带信号被表示为指数/尾数并随后被量化。采用前向-后向自适应的心理声学模型来优化量化并减少编码比特分配信息所需的比特。为了降低解码器的复杂度而不使用熵编码。最后,量化指数及其它辅助信息被多路复用成一个完整的AC-3比特流。AC-3中配置的自适应MDCT的频率分辨率没有很好地与输入信号特性相匹配,因此它的压缩特性受到很大的限制。熵编码的缺少是限制其压缩特性的另一个因素。
MPEG1&2层|||(MP3)使用一个32频带的多相滤波器组,其中的每个子带滤波器都跟随有一个在6和18点之间切换的自适应MDCT。一个高级心理声学模型被用来指导其比特分配和标量非均匀量化。哈夫曼(Huffman)码被用来编码量化指数和大部分的其它辅助信息。混合滤波器组的较差的频率隔离极大地限制了它的压缩特性而且具有很高的算法复杂性。
DTS相干声学采用一个32频带的多相滤波器组以获得输入信号的低分辨率频率表示。为了补偿较差的频率分辨率,ADPCM(自适应差分脉码调制)被选择性地用于每个子带。如果ADPCM产生一个良好的编码增益,则均匀标量量化被直接应用于子带样本或应用于预测残差。矢量量化可以选择性地被应用到高频率的子带。哈夫曼码可以选择性地被应用到标量量化指数及其它辅助信息。因为多相滤波器组+ADPCM的结构根本不能提供良好的时间和频率分辨率,所以它的压缩特性很低。
MPEG 2 AAC和MPEG 4 AAC采用一个自适应MDCT滤波器组,其窗口尺寸可以在256和2048之间切换。心理声学模型产生的掩蔽阈值被用来指导其标量非均匀量化和比特分配。哈夫曼码被用来编码量化指数和大部分的其它辅助信息。诸如TNS(暂时噪声整形)、增益控制(类似于MP3的混合滤波器组)、频谱预测(子带内的线性预测)之类的许多其它的工具被用来进一步增强它的压缩特性,而这以极大地增加了算法复杂性为代价。
因此,仍然需要一个低比特率的音频编码系统,其极大地降低了多声道音频信号的比特率以用于有效发送或存储,而同时也能获得透明的音频信号再现。本发明满足了这个需要并提供了其它的相关优点。
发明内容
在以下讨论中,术语″分析/合成滤波器组″等指的是执行时间-频率的分析/合成的设备或方法。它可以非限制性地包括如下:
●酉变换;
●临界采样的、均匀的、或非均匀的带通滤波器组时变或非时变组;
●谐波或正弦波的分析器/合成器。
多相滤波器组、DFT(离散傅里叶变换)、DCT(离散余弦变换)以及MDCT是一些被广泛使用的滤波器组。术语″子带信号或子带样本″等指的是出自分析滤波器组和进入合成滤波器组的信号或样本。
本发明的一个目的是为多声道音频信号的低比特率编码提供与现有技术同样水平的压缩性能但却降低了算法复杂性。
这由编码器在编码端侧完成,编码器包括:
1)成帧器,用于把输入的PCM样本聚类分割成准稳态帧,其大小是分析滤波器组的子带数的整数倍,并且其时间范围是2到50ms。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州广晟数码技术有限公司,未经广州广晟数码技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710105144.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提高干燥窑利用率的方法
- 下一篇:安全帽的帽檐结构