[发明专利]具有动态可变规整特性的音频编码器、音频解码器和音频处理器有效
申请号: | 200780030281.3 | 申请日: | 2007-05-16 |
公开(公告)号: | CN101501759A | 公开(公告)日: | 2009-08-05 |
发明(设计)人: | 于尔根·赫勒;伯恩哈德·格瑞;马库斯·马特拉斯;斯特凡·拜尔;乌尔里希·克拉梅尔;延斯·希斯费尔德;斯特凡·瓦希尼克;格拉尔德·舒勒 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/00 | 分类号: | G10L19/00 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 王波波 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 动态 可变 规整 特性 音频 编码器 解码器 处理器 | ||
技术领域
本发明涉及采用规整滤波器的音频处理,具体涉及多用途音频编码。
背景技术
在低比特率音频以及语音编码技术环境下,传统上采用几种不同的编 码技术,从而在给定速率下以尽可能好的主观质量对此类信号进行低比特 率编码。一般的音乐/声音信号所用的编码器旨在,根据掩蔽阈值曲线对量 化误差的谱(时域)形状进行成形,以优化主观质量,所述掩蔽阈值曲线 是利用感知模型(“感知音频编码”)根据输入信号来估计得到的。另一方 面,当基于人类语音的产生模型进行语音编码时,以极低的比特率进行语 音编码是很有效的,所述基于人类语音的产生模型进行语音编码,即:使 用线性预测编码(LPC)以对人类声道的谐振效应进行建模,并对残差激 励信号进行高效编码。
由于上述两种不同方法的缘故,对于极低数据速率的语音信号,一般 的音频编码器(如MPEG-1层3、或MPEG-2/4高级音频编码、AAC)由 于没有利用语音源模型,因此其性能通常不如专用的基于LPC的语音编码 器好。相反,基于LPC的语音编码器在应用于一般的音乐信号时,由于不 能根据掩蔽阈值曲线灵活地将编码失真的谱包络进行成形,因此通常不能 取得令人满意的结果。本发明的目的在于,提供一种概念,将基于LPC 的编码同感知音频编码的优势合并于单一框架下,从而提出对于一般音频 和语音信号均很有效的统一音频编码。
以下部分对一组为高效地对音频以及语音信号进行编码而提出的相 关技术进行说明。
感知音频编码(图9)
传统上,感知音频编码器使用基于滤波器组的方法,来高效地对音频 信号进行编码,以及根据对掩蔽曲线的估计,将量化失真成形。
图9示出了单声道感知编码系统的基本方框图。分析滤波器组用于将 时域采样映射至子采样谱分量。
根据谱分量的数目,系统还被称为子带编码器(子带数目较少,例如, 32)或基于滤波器组的编码器(谱线数目很大,例如,512)。感知(“心 理声学”)模型用于估计实际的时间相关掩蔽阈值。谱(“子带”或“频域”) 分量的量化和编码方式为,将量化噪声隐藏在实际的发送信号下,并且在 解码之后无法察觉量化噪声。这是通过在时域和频域上改变谱值的量化粒 度来实现的。
最近提出了一种基于前置/后置滤波的编码,作为完全基于滤波器组的 感知编码概念的可替换方法,如图10所示。
在[Ed 100]中,提出了一种感知音频编码器,该感知音频编码器通过 使用所谓的前置滤波器而不是频域上的谱系数的可变量化,将减小非相关 性(即,根据感知准则进行噪声成形)以及减小冗余(即,获得在数学上 更加简洁的信息表示)的方面进行分离。在下图中对该原理进行了说明。 感知模型对输入信号进行分析,以估算以频率为自变量的掩蔽阈值曲线。 将掩蔽阈值转换为一组前置滤波器系数,使前置滤波器频率响应的幅度与 掩蔽阈值成反比。前置滤波操作将这组系数作用于输入信号,从而产生输 出信号,其中,根据频率分量的感知重要性表现全部频率分量(“感知白 化”)。接着,利用任意类型的音频编码器对该信号进行编码,即不采用任 何感知噪声成形,从而产生“白”量化失真。因此,音频信号的传输/存储包 括编码器的比特流以及前置滤波系数的编码版本。在解码器中,将编码器 比特流解码为中间音频信号,接着根据所发送的滤波器系数对中间音频信 号进行后置滤波操作。由于后置滤波器执行与前置滤波器相对的逆滤波过 程,因此它根据掩蔽曲线对其输入信号应用谱加权。采用这种方法,像预 期的那样,谱平坦(“白”)编码噪声看似在解码器输出端得到感知成形。
由于在这样的方案中感知噪声成形是通过前置/后置滤波步骤而不是 通过对谱系数进行频率相关量化来实现的,因此可以将此概念推广为包 括:除基于滤波器组的音频编码器以外的、用于表示经前置滤波的音频信 号的非基于滤波器组的编码机制。在[Sch02]中,针对使用预测和熵编码级 的时域编码核示出了这个概念。
[Edl00]B.Edler,G.Schuller:″Audio coding using a psychoacoustic pre-and post-filter″,ICASSP 2000,Volume 2,5-9June 2000Page(s):II881- II884vol.2
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780030281.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:存储器结构及其编程方法
- 下一篇:用于凸起材料检测的方法与装置