[发明专利]用于在多声道音频格式之间进行转换的方法和设备无效
申请号: | 200880009025.0 | 申请日: | 2008-02-01 |
公开(公告)号: | CN101669167A | 公开(公告)日: | 2010-03-10 |
发明(设计)人: | V·普尔基;J·赫尔 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;H04S3/02 |
代理公司: | 江门嘉权专利商标事务所有限公司 | 代理人: | 张 萍 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 多声道 音频格式 之间 进行 转换 方法 设备 | ||
技术领域
本发明涉及一种关于如何以最大可能的质量在不同的多声道音频格式之间进行转换的技术,而不限于特定的多声道表示。即本发明涉及一种允许在任意多声道格式之间进行转换的技术。
背景技术
通常,在多声道再现和收听中,收听者被多个扬声器环绕。存在捕获针对特定设置(set-up)的音频信号的各种方法。再现时的一个通常目标是再现原始记录的声音事件的空间合成,即各个音频源的源点(origin),如管弦乐队内喇叭的位置。多个扬声器设置是相当常见的,并且可以产生不同的空间感。不使用特殊的后生产技术,通常已知的两声道立体声设置可以仅在两个扬声器之间的线上重建听觉事件。这主要通过所谓的“振幅-移动(panning)”来实现,其中取决于音频源相对于扬声器的位置,与一个音频源相关的信号的振幅分布在两个扬声器之间。这通常在记录或后续的混音期间进行。即来自相对于收听位置较远左侧的音频源将主要通过左扬声器再现,而在收听位置前面的音频源将通过这两个扬声器以相同的振幅(电平)再现。然而,不能再现从其他方向发出的声音。
因此,通过使用分布在收听者周围的更多扬声器,可以覆盖更多方向,并且可以产生更加自然的空间感。可能最公知的多声道扬声器布局是5.1标准(ITU-R775-1),其包括5个扬声器,将这些扬声器相对于收听位置的方位角预先确定为0°、±30°和±110°。这表示在记录或混音期间,将信号调整为特定扬声器配置,而且根据该标准的再现设置的偏差将导致再现质量降低。
也提出了具有位于不同方向上的不同数目的扬声器的多个其他系统。专业和专用系统(尤其在影院和声音装置中)也包括不同高度的扬声器。
近年来提出了被称为DirAC的通用音频再现系统,其能够记录并再现针对任意扬声器设置的声音。DirAC的目的是使用具有任意几何设置的多声道扬声器系统,尽可能精确地再现现有声学环境的空间感。在记录环境中,以全向麦克风(W)和允许测量声音到达方向以及声音扩散的麦克风组来测量环境的响应(可以是连续记录的声音或脉冲响应)。在以下段落中以及在本申请中,术语“扩散”应被理解为针对声音的非方向性测量。即,以相等的强度从所有方向到达收听或记录位置的声音是最大扩散的。量化扩散的通常方式是使用来自区间[0,…,1]的扩散值,其中,值1描述了最大扩散声音,而值0描述了理想定向声音,即仅从一个可清晰辨识的方向发出的声音。一个通常已知的测量声音到达的方向的方法是应用与笛卡尔坐标轴对齐的3个八字(figure-of-eight)麦克风(XYZ)。已设计出被称作“声场麦克风”的专用麦克风,该麦克风直接产生所有期望的响应。然而,如以上所提及的,W、X、Y和Z信号也可以根据离散全向麦克风组进行计算。
近来,Goodwin和Jot提出了利用伴随的方向数据,将任意多个声道的音频格式存储至音频的一个或两个下混音声道的方法。该格式可以应用于任意的再现系统。使用“Gerzon矢量(包括速度矢量和能量矢量)”来计算定向数据(即,具有与音频源的方向有关的信息的数据)。速度矢量是从收听位置指向扬声器的矢量的加权和,其中每个权重是扬声器的给定时间/频率瓦(tile)处的频谱的幅值。能量矢量是类似的加权矢量和。然而,权重是扬声器信号的短时能量估计,即其描述了稍微平滑的信号或包含在有限长度时间间隔内的信号中的信号能量的积分。具有充分根据的是,这些矢量共有的缺点是与实际的或感知的量不相关。例如,没有适当地考虑扬声器相对于彼此的相对相位。例如,这表示,如果将宽带信号馈入相反相位的收听位置之前的立体声设置的扬声器,则收听者将感知到来自周围方向的声音,收听位置中的声场将具有从一侧到另一侧(例如,从左侧到右侧)的声音能量振荡。在这种场景下,Gerzon矢量将会指向前方,显然这并不表示实际的或感知的情况。
自然地,市场上存在多个多声道格式或表示,存在能够在不同表示之间转换的需求,从而可以利用最初针对可选的多声道表示而开发的设置来再现各个表示。即例如,可能需要5.1声道与7.1或7.2声道之间的转换,以使用现有的7.1或7.2声道回放设置来回放通常在DVD上使用的5.1多声道表示。多种音频格式使音频内容生产变得困难,因为所有格式需要特定的混频和存储/传输格式。因此,用于不同再现设置上的回放的不同记录格式之间的转换是必需的。
提出了多种方法将特定音频格式的音频转换为另一音频格式。然而,总是将这些方法调整为特定多声道格式或表示。即这些仅可应用于从一个特定的预定多声道表示至另一特定的多声道表示的转换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880009025.0/2.html,转载请声明来源钻瓜专利网。