[发明专利]语音与音频信号的改进的变换编码有效
申请号: | 200880104834.X | 申请日: | 2008-08-26 |
公开(公告)号: | CN101790757A | 公开(公告)日: | 2010-07-28 |
发明(设计)人: | M·布赖恩德;A·塔莱布 | 申请(专利权)人: | 爱立信电话股份有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;H04B1/66 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 马永利;徐予红 |
地址: | 瑞典斯*** | 国省代码: | 瑞典;SE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 音频 信号 改进 变换 编码 | ||
技术领域
本发明总体上涉及诸如信号压缩和音频编码之类的信号处理,更特 别地涉及改进的变换语音与音频编码以及相应的设备。
背景技术
编码器是一种能够分析诸如音频信号之类的信号并以编码的形式 输出信号的设备、电路或计算机程序。所得到的信号通常用于传输、存 储和/加密的目的。另一方面,解码器是一种能够反转编码器操作的设备、 电路或计算机程序,因为其接收编码的信号并输出解码的信号。
在大多数现有技术的编码器(例如音频编码器)中,分析输入信号 的每个帧并且将其从时域变换到频域。这一分析的结果被量化和编码, 并且然后根据应用进行传输或存储。在接收侧(或者当使用所存储的编 码信号时),后面是合成过程的相应解码过程使得有可能在时域中恢复 信号。
编解码器(编码器-解码器)通常用于压缩/解压缩信息(例如音频 和视频数据)以便通过带宽受限的通信信道进行高效的传输。
所谓的变换编码器或更一般而言变换编解码器通常基于时域到频 域的变换,例如DCT(离散余弦变换)、改进的离散余弦变换(MDCT) 或相对于听觉系统特性允许更好编码效率的某种其他重叠变换。变换编 解码器的共同特性是,它们对重叠采样块(即重叠帧)进行操作。由每 个帧的变换分析或等效子带分析所产生的编码系数通常被量化和存储 或者作为比特流传输到接收侧。解码器一接收到比特流就执行解量化和 逆变换以便重构信号帧。
所谓的感知(perceptual)编码器使用接收目的地(即人类听觉系统) 的有损编码模型,而不是源信号的模型。因此,感知音频编码需要编码 音频信号、结合听觉系统的心理声学知识,以便优化/减少忠实再现原始 音频信号所必需的比特数量。另外,感知编码试图除去即不传输或近似 人类接收者不能感知的信号部分,即与源信号的无损编码相对的有损编 码。该模型通常被称为心理声学模型。一般来说,感知编码器将具有比 波形编码器更低的信噪比(SNR),并且具有比以相等比特率操作的无 损编码器更高的感知质量。
感知编码器在不引入听得到的量化噪声的情况下使用刺激的掩蔽 模式(masking pattern)来确定编码即量化每个频率子带所必需的最少 比特数。
操作在频域中的现有感知编码器通常使用所谓的绝对听觉阈值 (ATH)与掩蔽的音调和类噪声扩散二者的组合,以便计算所谓的掩蔽 阈值(MT)[1]。基于这样的瞬时掩蔽阈值,现有的心理声学模型计算 被用来定形原始频谱的标度因子,以使编码噪声被高能量级分量掩蔽, 例如听不到由编码器引入的噪声[2]。
感知建模已被广泛地用于高比特率音频编码中。标准化的编码器 (例如MPEG-1层III[3]、MPEG-2高级音频编码[4])以128kbps的速率 并且对于宽带音频相应地以64kbps的速率来实现“CD质量”。不过, 这些编解码器根据定义被强制低估掩蔽的量以确保仍然听不到失真。而 且,宽带音频编码器通常使用高复杂性的听觉(心理声学)模型,其在 低比特率(低于64kbps)下不是非常可靠的。
发明内容
由于前面提到的问题,所以需要在保持低复杂性功能的同时在低比 特率下可靠的改进的心理声学模型。
本发明克服了现有技术方案的这些和其他缺点。
基本上,在对电信系统中的音频信号进行感知变换编码的方法中, 最初确定表示时间分段的输入音频信号的时间到频率的变换的变换系 数,基于所确定的变换系数来确定输入音频信号的感知子带的频谱。随 后,基于所述确定的频谱来确定每个子带的掩蔽阈值,对于所确定的其 各自的掩蔽阈值来计算每个子带的标度因子。最后,适配每个子带的所 计算的标度因子以防止由于用于感知上相关的子带的编码而产生的能 量损失,即以便达到高质量的低比特率编码。
当阅读下面对本发明实施例的描述时,将会认识到由本发明提供的 更多优点。
附图说明
通过参考与附图一起得到的下面的描述,可以最好地理解本发明连 同其更多的目的和优点,其中:
图1示出适合于全带音频编码的示例性编码器;
图2示出适合于全带音频解码的示例性解码器;
图3示出通用的感知变换编码器;
图4示出通用的感知变换解码器;
图5示出根据本发明的心理声学模型中的方法的一个流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于爱立信电话股份有限公司,未经爱立信电话股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880104834.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:楔形连接器组件
- 下一篇:分发软件的方法和具有该方法的客户机装置