[发明专利]用于合并基于几何的空间音频编码流的设备和方法有效
申请号: | 201280067983.X | 申请日: | 2012-11-30 |
公开(公告)号: | CN104185869B9 | 公开(公告)日: | 2018-01-12 |
发明(设计)人: | 吉奥范尼·德加尔多;奥利弗·蒂尔加特;于尔根·赫勒;法比安·屈希;埃马努埃尔·哈贝特斯;亚历山德拉·克勒琼;阿希姆·孔茨 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 康建峰,李春晖 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 合并 基于 几何 空间 音频 编码 设备 方法 | ||
技术领域
本发明涉及音频处理,更具体地,涉及一种用于产生合并的音频数据流的设备和方法。
背景技术
音频处理,特别是空间音频编码,变得越来越重要。传统的空间录音目的在于捕捉声场,使得在再现侧聆听者将声像(sound image)视作在录音地点的声像。从现有技术水平得知实现空间声音录制和再现技术的不同方法,这些方法可基于声道式表示、对象式表示或参数式表示。
声道式表示(channel-based representation)表示利用N个离散音频信号的声音场景,N个离散音频信号意味着要由以一种已知设置(例如5.1环绕声效设置)布置的N个扬声器回放。空间声音录制的方法通常采用分隔开的全向麦克风(例如,在AB立体声中)或者一致定向麦克风(例如,在强度立体声中)。或者,例如在高保真度立体声响复制(Ambisonics)中,可采用更复杂的麦克风,例如B-格式麦克风,参见:
[1]“Michael A.Gerzon.Ambisonics in multichannel broadcasting and video.J.Audio Eng.Soc,33(11):859–871,1985.”。
已知设置的期望扬声器信号直接源于录制的麦克风信号,并且然后离散地进行传输或储存。通过将音频编码应用于离散信号来获得更有效的表示,该音频编码在某些情况下为了增加效率而对不同声道的信息联合地编码,例如在5.1的MPEG环绕声(MPEG-Surround)中,参见:
[21]“J.Herre,K.J.Breebaart,C.Faller,S.Disch,H.Purnhagen,J.Koppens,J.Hilpert,J.W.Oomen,K.Linzmeier,K.S.Chong:“MPEG Surround–The ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding”,122nd AES Convention,Vienna,Austria,2007,Preprint 7084.”。
这些技术的主要缺点是:一旦已经计算了扬声器信号,声音场景就不能修改。
对象式表示(object-based representation)例如用在空间音频对象编码(SAOC,Spatial Audio Object Coding)中,参见
[25]“Jeroen Breebaart,JonasCornelia Falch,Oliver Hellmuth,Johannes Hilpert,Andreas Hoelzer,Jeroens Koppens,Werner Oomen,Barbara Resch,Erik Schuijers,and Leonid Terentiev.Spatial audio object coding(saoc)-the upcoming mpeg standard on parametric object based audio coding.In Audio Engineering Society Convention 124,52008.”。
对象式表示表示具有N个离散音频对象的声音场景。这种表示因为能够通过改变例如每个对象的位置和响度(loudness)来操控声音场景所以在再现侧提供了高灵活性。虽然从例如多轨录音可容易地得到这种表示,但却很难从利用一些麦克风录音的复合声音场景获得这种表示(例如,参见[21])。事实上,讲话者(或其它声音发射对象)必须首先进行定位并且然后从混合中被提取出来,这可能导致假象(artifacts)。
参数式表现(parametric representation)常常采用空间麦克风来确定一个或更多个音频缩混(downmix)信号和描述空间声音的空间侧信息。一个示例是定向音频编码(DirAC,Directional Audio Coding),如在以下文献中所讨论的:
[29]“Ville Pulkki.Spatial sound reproduction with directional audio coding.J.Audio Eng.Soc,55(6):503–516,June 2007.”。
术语“空间麦克风”指用于获得能够找回声音到达方向(direction of arrival of sound)的空间声音的任何设备(例如,定向麦克风的组合、麦克风阵列等)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280067983.X/2.html,转载请声明来源钻瓜专利网。