[发明专利]具有动态可变规整特性的音频编码器、音频解码器和音频处理器有效

申请号：	200780030281.3	申请日：	2007-05-16
公开（公告）号：	CN101501759A	公开（公告）日：	2009-08-05
发明（设计）人：	于尔根·赫勒;伯恩哈德·格瑞;马库斯·马特拉斯;斯特凡·拜尔;乌尔里希·克拉梅尔;延斯·希斯费尔德;斯特凡·瓦希尼克;格拉尔德·舒勒	申请（专利权）人：	弗劳恩霍夫应用研究促进协会
主分类号：	G10L19/00	分类号：	G10L19/00
代理公司：	中科专利商标代理有限责任公司	代理人：	王波波
地址：	德国***	国省代码：	德国;DE
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	具有动态可变规整特性音频编码器解码器处理器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及采用规整滤波器的音频处理，具体涉及多用途音频编码。

背景技术

在低比特率音频以及语音编码技术环境下，传统上采用几种不同的编码技术，从而在给定速率下以尽可能好的主观质量对此类信号进行低比特率编码。一般的音乐/声音信号所用的编码器旨在，根据掩蔽阈值曲线对量化误差的谱(时域)形状进行成形，以优化主观质量，所述掩蔽阈值曲线是利用感知模型(“感知音频编码”)根据输入信号来估计得到的。另一方面，当基于人类语音的产生模型进行语音编码时，以极低的比特率进行语音编码是很有效的，所述基于人类语音的产生模型进行语音编码，即：使用线性预测编码(LPC)以对人类声道的谐振效应进行建模，并对残差激励信号进行高效编码。

由于上述两种不同方法的缘故，对于极低数据速率的语音信号，一般的音频编码器(如MPEG-1层3、或MPEG-2/4高级音频编码、AAC)由于没有利用语音源模型，因此其性能通常不如专用的基于LPC的语音编码器好。相反，基于LPC的语音编码器在应用于一般的音乐信号时，由于不能根据掩蔽阈值曲线灵活地将编码失真的谱包络进行成形，因此通常不能取得令人满意的结果。本发明的目的在于，提供一种概念，将基于LPC 的编码同感知音频编码的优势合并于单一框架下，从而提出对于一般音频和语音信号均很有效的统一音频编码。

以下部分对一组为高效地对音频以及语音信号进行编码而提出的相关技术进行说明。

感知音频编码(图9)

传统上，感知音频编码器使用基于滤波器组的方法，来高效地对音频信号进行编码，以及根据对掩蔽曲线的估计，将量化失真成形。

图9示出了单声道感知编码系统的基本方框图。分析滤波器组用于将时域采样映射至子采样谱分量。

根据谱分量的数目，系统还被称为子带编码器(子带数目较少，例如， 32)或基于滤波器组的编码器(谱线数目很大，例如，512)。感知(“心理声学”)模型用于估计实际的时间相关掩蔽阈值。谱(“子带”或“频域”) 分量的量化和编码方式为，将量化噪声隐藏在实际的发送信号下，并且在解码之后无法察觉量化噪声。这是通过在时域和频域上改变谱值的量化粒度来实现的。

最近提出了一种基于前置/后置滤波的编码，作为完全基于滤波器组的感知编码概念的可替换方法，如图10所示。

在[Ed 100]中，提出了一种感知音频编码器，该感知音频编码器通过使用所谓的前置滤波器而不是频域上的谱系数的可变量化，将减小非相关性(即，根据感知准则进行噪声成形)以及减小冗余(即，获得在数学上更加简洁的信息表示)的方面进行分离。在下图中对该原理进行了说明。感知模型对输入信号进行分析，以估算以频率为自变量的掩蔽阈值曲线。将掩蔽阈值转换为一组前置滤波器系数，使前置滤波器频率响应的幅度与掩蔽阈值成反比。前置滤波操作将这组系数作用于输入信号，从而产生输出信号，其中，根据频率分量的感知重要性表现全部频率分量(“感知白化”)。接着，利用任意类型的音频编码器对该信号进行编码，即不采用任何感知噪声成形，从而产生“白”量化失真。因此，音频信号的传输/存储包括编码器的比特流以及前置滤波系数的编码版本。在解码器中，将编码器比特流解码为中间音频信号，接着根据所发送的滤波器系数对中间音频信号进行后置滤波操作。由于后置滤波器执行与前置滤波器相对的逆滤波过程，因此它根据掩蔽曲线对其输入信号应用谱加权。采用这种方法，像预期的那样，谱平坦(“白”)编码噪声看似在解码器输出端得到感知成形。

由于在这样的方案中感知噪声成形是通过前置/后置滤波步骤而不是通过对谱系数进行频率相关量化来实现的，因此可以将此概念推广为包括：除基于滤波器组的音频编码器以外的、用于表示经前置滤波的音频信号的非基于滤波器组的编码机制。在[Sch02]中，针对使用预测和熵编码级的时域编码核示出了这个概念。

[Edl00]B.Edler，G.Schuller：″Audio coding using a psychoacoustic pre-and post-filter″，ICASSP 2000，Volume 2，5-9June 2000Page(s)：II881- II884vol.2

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会，未经弗劳恩霍夫应用研究促进协会许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200780030281.3/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]具有动态可变规整特性的音频编码器、音频解码器和音频处理器有效

专利文献下载