[发明专利]对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置有效
申请号: | 201480023877.0 | 申请日: | 2014-04-24 |
公开(公告)号: | CN105144752B | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | A.克勒格尔;S.科登 | 申请(专利权)人: | 杜比国际公司 |
主分类号: | H04S3/00 | 分类号: | H04S3/00;G10L19/008 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 宿小猛 |
地址: | 荷兰阿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 更高 保真度 立体 声响 复制 表示 进行 压缩 和解 方法 装置 | ||
技术领域
本发明涉及通过有区别地处理定向和环境信号分量对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置。
背景技术
更高阶高保真度立体声响复制(HOA)连同像波长合成(WFS)这样的其他技术或者像22.2这样的基于信道的方法一起提供表示三维声音的一种可能性。然而,相对于基于信道的方法,HOA表示提供独立于具体扬声器设置的优点。然而,这个灵活性以HOA表示在特殊的扬声器设置上回放所必需的解码处理为代价。与必需的扬声器的数量通常非常大的WFS方法相比,HOA还可以被呈现给包括仅几个扬声器的设置。HOA的另外的优点在于,对于到头戴耳机的双耳呈现,也可以使用相同的表示而不用做任何修改。
HOA基于按照截断的球谐(Spherical Harmonics,SH)扩展的复谐平面波(complex harmonic plane wave)幅度的空间密度的表示。每个扩展系数是角频率的函数,其可以由时域函数等同地表示。因此,在不失一般性的情况下,完整的HOA声场表示实际上可以被假设为包括O个时域函数,其中O标记扩展系数的数量。这些时域函数将等同地被称作HOA系数序列或者称作HOA信道。
HOA表示的空间分辨率随着扩展的最大阶N的增长而提高。不幸地,扩展系数的数量O随着阶N二次方地增长,具体地,O=(N+1)2。例如,使用阶N=4的典型的HOA表示需要O=25个HOA(扩展)系数。根据先前做出的考虑,给定期望的单信道采样率fS和每个样本的位数Nb,用于传输HOA表示的总比特率由O·fS·Nb确定。因此,以fS=48kHz的采样率并且使用每个样本Nb=16位来传输阶N=4的HOA表示导致19.2MBits/s的比特率,这对于许多实际的应用(例如对于流传输)非常高。
HOA声场表示的压缩在专利申请EP 12306569.0和EP 12305537.8中提出。代替单独地对HOA系数序列中的每一个进行感知编码,例如像在E.Hellerud、I.Burnett、A.Solvang和U.P.Svensson的“Encoding Higher Order Ambisonics with AAC”(第124届AES会议,阿姆斯特丹,2008年)中执行的那样,具体通过执行声场分析并且将给定的HOA表示分解成定向和残余环境分量来试图减少被感知编码的信号的数量。定向分量通常应当由可以被视为一般平面波函数的少量的支配定向信号来表示。残余环境HOA分量的阶减小,因为假设在提取支配定向信号之后,更低阶的HOA系数承载大部分相关信息。
发明内容
总之,通过这样的操作,要被感知编码的HOA系数序列的初始数量(N+1)2被减少至固定数量的D个支配定向信号以及表示具有截断的阶NRED<N的残余环境HOA分量的数量(NRED+1)2个HOA系数序列,从而要编码的信号的数量是固定的,亦即D+(NRED+1)2。特别地,该数量独立于在时帧(time frame)k中的活动的支配(dominant)定向声源的实际检测到的数量DACT(k)≤D。这意味着,在时帧k中,其中活动的支配定向声源的实际检测到的数量DACT(k)小于定向信号的最大允许数量D,要被感知编码的支配定向信号中的一些或者甚至是全部为零。最后,这意味着这些信道根本不用于捕捉声场的相关信息。
在该背景下,EP 12306569.0和EP 12305537.8会议录中的另外可能的弱点是用于在每个时帧中确定活动的支配定向信号的数量的标准,因为不试图确定关于声场的相继感知编码的活动的支配定向信号的最佳数量。例如,在EP 12305537.8中,使用简单的功率标准,也就是通过确定属于最大特征值的系数间相关矩阵的子空间的维度,来估计支配声源的量。在EP 12306569.0中,提出对支配定向声源的递增检测,其中如果来自各自方向的平面波函数的功率关于第一定向信号足够高,则定向声源被认为是支配的。使用像在EP 12306569.0和EP 12305537.8中那样的基于功率的标准可能导致关于声场的感知编码是次优的定向环境分解(directional-ambient decomposition)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比国际公司,未经杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480023877.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:防走光裙子
- 下一篇:一种健康味美的南瓜浓汤及其制作方法