[发明专利]包括幅度包络的参数音频编码无效
申请号: | 200580037709.8 | 申请日: | 2005-10-28 |
公开(公告)号: | CN101053018A | 公开(公告)日: | 2007-10-10 |
发明(设计)人: | M·G·克里斯坦森;S·L·J·D·E·范德帕尔 | 申请(专利权)人: | 皇家飞利浦电子股份有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/08 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 程天正;刘红 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包括 幅度 包络 参数 音频 编码 | ||
技术领域
本发明涉及高质量低比特率音频信号编码领域。本发明尤其涉及基于参数编码且用于有效编码以及瞬态声的情况下的高声音质量的音频编码。更具体地,本发明涉及基于幅度调制的和恒定幅度正弦曲线的组合编码。
背景技术
音频编码中的典型问题是前回音失真,即错误发生在开始(onset)之前。与存在掩码(marsker)时的情形相比较,这些错误非常不易被人类的听觉系统掩蔽。因此,量化错误发生在瞬态前很可能引起明显的听觉失真。因此,对于合适地编码瞬态声,必须特别关注。
可以测量预掩蔽,通常其持续仅仅大约20ms,而滞后掩蔽可以持续长于100ms。另外,应注意的是该掩蔽现象基于临界频带发生,即它们基于宽带无法被精确地处理。许多音频编码技术,如正弦编码器,用10-20ms的驻波分量为音频信号建模。然后,需要许多分量为短的持续时间瞬态建模。
在参数音频建模及编码内,幅度调制的正弦模型是捕捉瞬态声的特征(例如在″钟乐器(Glockenspiel)″和″响板(Castanets)″摘录中遇到的特征)所关注的。例如,在音频建模的情景下为此目的减幅正弦波已受到一些关注。
在音频编码中使用幅度调制的现有技术解决方案的例子是B.Edler,H.Purnhagen和C.Ferekidis的″Analysis/Synthesis Audio Codecfor Very Low Bit Rates″(100th Conv.Audio Eng.Soc.preprint4179,1996)以及Schuijers,Oomen,den Brinker和Gerrits的″Advances in parametric coding for high-quality audion″(Proc.1st IEEE Benelux Workshop on Model Based Processing and Codingof Audio(MPCA-2002))。然而,这些在其瞬态的定义、检测及编码中都是单波带的,意思是包络对所有分量来说都是相同的。不过,在″Analysis/Synthesis Audio Codec for Very Low Bit Rates″中,对于每个分量都要判定是否要应用一个被估计的包络。
所提到的现有技术的例子都存在着如下缺点:幅度调制信号的窗口长度或估计可以由强驻波低频分量占主导,而较弱的瞬态出现在高频处,因此引起听觉假象。另一缺点是:因存在高频瞬态的原因而要挑选短的窗口长度,因此导致频率分辨率很差,以致于降低驻波低频信号部分的听觉质量。
发明内容
可以看到本发明的目的是提供一种幅度调制正弦音频编码器,它在速率失真方面是高效的,意思是,在给定比特率的情况下,与传统的正弦编码器相比较,它实现了更低的失真,而且它在复杂性方面也是高效的,且同时它能够处理瞬态声音而没有严重的听觉假象。
根据本发明的第一方面,该目的通过提供一种适于对音频信号编码的音频编码器来实现,该音频编码器包括:
-正弦类型编码器,适于产生第一编码信号部分,该部分包括第一多个正弦分量,以及
-幅度调制编码器,适于产生第二编码信号部分,该部分包括第二多个正弦分量,所述第二多个正弦分量被单独分配有与时变幅度包络有关的至少一个参数,
其中该音频编码器包括适于相对于预定的编码效率标准评价第一与第二编码信号部分并响应其而产生编码的输出信号的装置。
根据本发明的第一方面的编码器还对瞬态音频信号提供高编码效率。原因是幅度调制编码器适于向每个单独的正弦分量分配幅度包络参数,优选地每个单独的正弦分量还在一个段内。因此,所述音频编码器能够精确地表示瞬态音频信号,原因在于它可以使一些正弦分量随时间相当大地变化,而其它的正弦分量可以是恒定的或者差不多是恒定的。据此,瞬态信号可以以一种方式来代表,使得可以避免或者至少相当大地减少明显的听觉前回音效应。这是优于现有技术编码器的一个优点。
根据本发明的第一方面的编码器也是高效的,原因在于音频输入信号的编码效率是相对于正弦类型编码器和幅度调制编码器而评价的,优选地,正弦类型编码器是传统的恒定幅度类型编码器。因此,在就一些预定的编码效率标准已评价是高效的时候,仅仅使用代表与每个正弦分量的时变幅度包络有关的参数的额外比特率。优选地,效率标准包括感知相关的失真测量。在优选的实施例中,所述效率标准包括总体比特率与感知失真测量的组合。使用感知失真测量,所感知的声音质量可以在判定幅度调制参数是否应被包含于编码的输出信号中予以考虑。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司,未经皇家飞利浦电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200580037709.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:轻击棒型球棒头
- 下一篇:用于传送幅料的红外线干燥设备