[发明专利]音频编码和解码有效
申请号: | 200680025555.5 | 申请日: | 2006-07-07 |
公开(公告)号: | CN101223575A | 公开(公告)日: | 2008-07-16 |
发明(设计)人: | E·G·P·舒杰斯;G·H·霍索;H·普尔恩哈根;W·A·施尔德巴克;H·霍里克;H·M·K·克约林;K·J·罗登 | 申请(专利权)人: | 皇家飞利浦电子股份有限公司;编码技术股份有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;H04S3/00 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 李静岚;谭祐祥 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 编码 解码 | ||
本发明涉及使用分级(hierarchical)编码结构和/或分级解码器结构的音频编码和/或解码。
在音频处理领域中,把多个音频通道(audio channel)转换成另外的更大数目的音频通道是熟知的。这样的变换可以因为各种原因而被执行。例如,音频信号可被转换成另一个格式,以提供增强的用户体验。例如,传统的立体声记录仅仅包括两个通道,而现代的先进的音频系统典型地使用五个或六个通道,如在流行的5.1环绕声系统中那样。因此,两个立体声通道可被转换成五个或六个通道,以便充分利用先进的音频系统。
通道转换的另一个原因是编码效率。已经发现,例如立体声音频信号可被编码成组合有描述音频信号的空间属性的参数比特流的单通道音频信号。解码器可以以非常令人满意的精度再生立体声音频信号。这样,可以得到很大的比特速率节省。
有几个参数可被使用来描述音频信号的空间属性。一个这样的参数是通道间的互相关,诸如在立体声信号的左通道与右通道之间的互相关。另一个参数是通道的功率比。在所谓的(参数)空间音频编码器中,从原始音频信号提取这些和其它参数,以便产生具有减小数目的通道-例如仅单个通道的音频信号,加上描述原始音频信号的空间属性的参数组。在所谓的(参数)空间音频解码器中,重建原始音频信号。
空间音频编码是最近引入来有效地编码多通道音频素材的技术。在空间音频编码中,M通道音频信号被描述为N通道音频信号加上一组相应的空间参数,其中N典型地小于M。因此,在空间音频编码器中,M通道信号被下混合为N通道信号,并且提取了空间参数。在解码器中,N通道信号和空间参数被利用来(感性地)重建M通道信号。
这样的空间音频编码优选地利用级联的或基于树的分级结构,包括在编码器和解码器中的标准单元。在编码器中,这些标准单元可以是把通道组合成较低数目的通道的下混合器(down-mixer),诸如2到1、3到1、3到2等等下混合器,而在解码器中,相应的标准单元可以是把通道分割(split)成较高数目的通道的上混合器(up-mixer),诸如1到2、2到3等等上混合器。
然而,这样的方法的问题在于,解码器结构必须匹配于编码器的结构。虽然这可以通过使用标准化的编码器和解码器结构而达到,但这样的方法是不灵活的,且将趋向于导致次最佳性能。
因此,改进的系统将是有利的,且特别是允许增加的灵活性、减小的复杂性和/或改进的性能的系统将是有利的,
因此,本发明寻求优选地单个地或组合地缓和、减轻或消除一个或多个上述的缺点。
按照本发明的第一方面,提供了用于生成多个输出音频通道的设备;该设备包括:用于接收包括多个输入音频通道和参数音频数据的数据流的装置;该数据流还包括用于一个分级解码器结构的解码器树结构数据,该解码器树结构数据包括至少一个数据值,指示在分级解码器结构的分级的层中用于音频通道的通道分割特性;响应于解码器树结构数据而生成分级解码器结构的装置;以及使用分级解码器结构从该数据流生成多个输出音频通道的装置。
本发明可以允许灵活地生成音频通道,以及具体地可以允许解码器功能性适配于用于生成数据流的编码器结构。本发明可以例如允许编码器选择用于多通道信号的适当的编码方法,而同时允许该设备自动地适配于它。本发明可以允许一数据流具有改进的质量-比特速率比值。具体地,本发明可以允许自动适配和/或高的灵活度,而同时提供从分级编码/解码结构可得到的改进的音频质量。而且本发明可以允许分级解码器结构的信息的有效通信。具体地,本发明可以允许对于解码器树结构数据的低的额外开销。本发明可以提供自动适配于所接收的比特流且可与任何适当的分级编码结构一起使用的设备。
每个音频通道可以支持一个个体音频信号。数据流可以是单个比特流,或可以例如是通过不同的分布通道分布的多个子比特流的组合。数据流可以具有有限的持续时间,诸如与给定尺寸的数据文件相对应的固定持续时间。通道分割特性可以是指示给定的音频通道在分级的层中被划分成多少通道的特性。例如,通道分割特性可以反映给定的音频通道是否没有被划分,或它是否被划分成两个音频通道。
解码器树结构数据可包括用于多个音频通道的分级解码器结构的数据。具体地,解码器树结构数据可包括用于多个输入音频通道的每个通道的一组数据。例如,解码器树结构数据可包括对于每个输入信号的用于一个解码器树结构的数据。
按照本发明的可选特征,解码器树结构数据包括多个数据值,每个数据值指示在分级解码器结构的一个分级的层中用于一个通道的通道分割特性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司;编码技术股份有限公司,未经皇家飞利浦电子股份有限公司;编码技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680025555.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无铅压电厚膜制备方法
- 下一篇:山核桃加工原料的贮藏保鲜方法