[发明专利]在解码器和相应设备中可靠识别和衰减数字信号中的回声的方法有效
申请号: | 200780006023.1 | 申请日: | 2007-02-13 |
公开(公告)号: | CN101390159A | 公开(公告)日: | 2009-03-18 |
发明(设计)人: | 巴拉斯·克韦希;阿兰·乐居亚代 | 申请(专利权)人: | 法国电信公司 |
主分类号: | G10L19/14 | 分类号: | G10L19/14 |
代理公司: | 北京律诚同业知识产权代理有限公司 | 代理人: | 徐金国;梁 挥 |
地址: | 法国*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解码器 相应 设备 可靠 识别 衰减 数字信号 中的 回声 方法 | ||
本发明涉及一种用于在解码器和相应设备中可靠识别和衰减数字信号中的回声的方法和设备。
对于数字音频信号在不论是固定、移动还是广播网络的传输网络中的传输,或者对于这些信号的存储来说,使用压缩过程来实现(可能是预测的)时间编码型或者所谓变换编码型的编码系统。
本发明的主题的方法和设备可应用于声音信号的压缩,这些声音信号特别是编码数字音频信号和语音信号,编码数字音频信号的帧是由乐器所产生的声音增大和/或减小的源,语音(voice)信号包括爆破音节,特别地,本发明的主题的方法和设备可应用于包括时域(预测的或其他)解码器和逆频率变换解码器多层解码设备。
图1示例性示出了根据现有技术通过变换和相加/叠加来编码和解码数字音频信号的示意图。
对上述编码和解码过程的更详细的说明,可以参考例如对于本申请人在2005年7月12日提交的0507471号法国专利申请的说明书介绍。
一些乐音,例如敲打声和某些语音序列例如爆破音节,其特征是具有非常突然的冲击(abrupt attack),反映为几个样本的空间(图1中从样本410开始)内采样信号的动态范围中非常强烈变化下的非常迅速的转变(transitions)。
变换编码所采用的将样本细分为连续的块的方式完全独立于该声音信号,因此这些转变出现在分析窗口中的任意点。现在,在变换编码中,噪声以时间顺序不均匀地分布在长度为2L的采样块的整个时间段。这反映为该转变之前的前回声(pre-echoes)的出现和该转变之后的后回声(post-echoes)的出现。
该噪声水平低于紧接在转变后的高能量样本的信号的噪声水平,但是高于低能量样本的信号的噪声水平,特别是显著高于该转变前的那部分(图1中的样本160-410)。对于上述部分,信噪比非常不好,并且命名为前回声的所导致的劣化可能非常讨厌。
从图1中可见,该前回声会影响该转变前的帧和其中发生转变的帧。
在实践中,在该冲击的生理传导之前,人耳应用一种相对有限的几毫秒级 的前屏蔽(pre-masking)。
当该前回声的时长大于该前屏蔽时长时,所产生的噪声或前回声是可以听到的。
人耳还对从高能序列到低能序列的转变应用一种更长时间段即5-60毫秒的后屏蔽(post-masking)。因此,后回声可以被忍受的讨厌级别或水平大于前回声。
当根据样本数的各块的长度增加时,更严重的前回声现象更讨厌。现在,在变换编码中,需要有对最重要频率区的精确分辨。在固定采样频率和固定比特率的情况下,如果窗口的点数增加,那么就有更多比特可用于对被音质模型(psycho-acoustic model)认为有用的频率行编码,因而具有使用较长长度块的优点。当执行一个编码过程例如AAC(高级音频编码)时,较长长度的窗口包含固定数量2048个样本,即在采样频率为32kHz时64ms时长上的样本。用于对话应用的编码器经常使用一窗口,其具有16kHz下的40ms时长,和20ms的帧更新时长。
为了减小上述前回声现象的讨厌影响以及将后回声现象的讨厌影响减小到更小程度,至今已经提出了各种解决方案。
第一种方案需要应用滤波。在由于冲击而发生的传输之前的区中,重建的信号实际上是由原始信号和叠加在该信号上的量化噪声构成的。
在Y.Mahieux和J.P.Petit于1994年11月发表于IEEE Trans onCommunications Vol 42 No.11上的、题目为High Quality Audio TransformCoding at 64kbits的文章中描述了相应的滤波技术。
实施这种滤波需要知道各参数,其中一些参数在解码器上根据噪声影响的样本来估计。然而,有些信息例如原始信号的能量仅能由编码器知道,因此必须被传输。当接收的块包含动态范围的突变时,对其进行滤波处理。
上述滤波过程不能重新得到原始信号,而是显著减小了前回声。然而,它要求将额外的辅助参数传输到解码器。
第二种方案涉及通过动态切换各窗口来减小前回声。
在授予B.Edler的美国专利5214742中描述了这种技术。这种方案已经成为根据国际标准的各种音频编码方案的应用主题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于法国电信公司,未经法国电信公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780006023.1/2.html,转载请声明来源钻瓜专利网。