[发明专利]用于布局与格式独立的三维音频再现的方法和装置有效
申请号: | 201280073062.4 | 申请日: | 2012-05-07 |
公开(公告)号: | CN104303522B | 公开(公告)日: | 2017-04-19 |
发明(设计)人: | 丹尼尔·阿特亚加巴列尔;波·阿鲁米亚尔博;安东尼奥·马特奥斯舒莱 | 申请(专利权)人: | 杜比国际公司 |
主分类号: | H04S3/00 | 分类号: | H04S3/00 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 朱胜,江河清 |
地址: | 荷兰阿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 布局 格式 独立 三维 音频 再现 方法 装置 | ||
技术领域
本发明一般地涉及音频编码,并且具体涉及与扬声器的数量和位置独立的任意三维扬声器布局中的音频再现。
背景技术
在多声道声音制作、分配和重放的背景下,内容产业采用了不同的标准。第一标准与基于一个单个独立的音频声道来实现单声道声音系统相关。后续标准演进到基于两个独立音频声道的立体声系统,然后演进到分别基于6个和8个独立音频声道的5.1声道和7.1声道。特别地,一大部分影院剧场已经采用了所谓的5.1声道配置,并且在国内市场已经相当多地部署了所谓的5.1声道配置。通过音频声道的逐步添加实现的这些标准的自然演进已经导致了下述两个方面:一方面是连续增强了听众的空间声音感知,以及另一方面是增大了内容创建者的创建自由。
在试图针对内容创建者和内容消费者二者继续进行这些增强时,下述建议同时存在,即采用具有越来越多的独立音频声道的基于多声道布局的标准,例如由THX的创始人Tomlinson Holman建议的10.2系统,以及由来自日本广播公司NHK的Kimio Hamasaki建议的22.2系统。由于这些系统包括处于不同高度的扬声器并且能够提供比当前的5.1系统或7.1系统更好的体验,所以通常将所有这些系统称为3D(三维)布局。
然而,所有这些建议有一些共同的缺点。由于在制作内容时,内容必须考虑各种可能的再现格式,所以在内容制作阶段它们都需要复杂的程序。内容制作必须满足最复杂的再现格式以及较简单的再现格式。由于声音工程师需要在头脑中不断进行需要处理整个布局的决定,例如如何将特定给定音轨路由到特定扬声器(例如,顶部中间极左声道),所以,在针对具有多个扬声器的布局的内容制作中,复杂性很大。这种脑力锻炼由于专注于技术任务而不是与再现的声音图像相关的美学处理限制了声音工程师的创建性。
扬声器安装困难是所有上述现有技术系统的另一个缺点。所有这些多声道格式需要再现地点中的每个扬声器的精确位置,根据给定标准,再现地点是专业影院或家庭环境。这是一个复杂且需要耗时的任务,需要专业声音技师的帮助。在许多情况下,由于特定地点的限制例如消防洒水器的位置、柱子、小的天花板高度、空调管道等,所有扬声器的正确定位是根本不可能的。在具有低数量的声道的系统例如立体声系统中,扬声器布局中的这个缺点是可忍受的。然而,随着声道的数量增大,这个问题变得难以处理,因此是不切实际的。
已经尝试了某些发展以通过实现音频工作流程来解决这些问题,由此内容创建与内容再现完全地分离。这种工作流程基于其中制作处理和后期制作处理与再现布局的细节完全独立的新范例。特别地,在这种工作流程中,后期制作的输出是通常以数字支持的原声音乐,原声音乐的生成基于各种声音编码技术,该声音编码技术不取决于期望的再现地点中的独立声道的数量和位置。
这种编码技术的早期示例是立体混响声和基于向量的幅度平移。Jot和Pulkki公开了中间声道独立编码方法的其他示例。在这些后面的工作中,通过在时频窗口中划分音频记录并且分析不同声道中的互相关,将空间位置分配给时频窗口中的每个时频窗口。这些现有技术方法的主要缺点中的一个缺点是时频分解不可避免地产生降低了最终再现的质量的可听处理制品。这限制了这些方法在其中仅接受最高质量再现的情况下的适用性。可听处理制品随着声道的数量增大而自身被放大。因此,使用多个声道来在3D环境中提供高质量再现的可能性极其有限。
许多声音源并不源自空间的单点,而是声音源具有一些内在的空间扩展,例如,周围声音经常在大的空间区域中扩展。另一个明显的示例是被认为是噪声的大卡车的声音在广泛区域中扩展。然而,尤其是当期望复杂尺寸时,用于声道独立音频编码的所有方法在对声音的表观尺寸的分配、操纵以及再现中表现出局限性。特别地,利用当前现有的音频编码方法,由多个分离区域组成的表观声音形状非常难以(如果不是不可能的)达到。这种由多个分离区域组成的声音形状的示例是来自不同街道的城市噪声或横向混响的声音。
因此,有必要提供多上述缺点的解决方案。特别地,期望以完全声道独立的方式来对声音进行编码,并且因此,在任何任意3D扬声器布局中声音是可再现的。还期望在不生成任何可听制品的情况下实现该目标。此外,期望利于对具有复杂表观尺寸包括多个分离形状的可能性的声音进行创建和操纵。
发明内容
因此,本发明的目的是提供对上述问题的解决方案。特别地,本发明的目的是提供关于用于处理音频信号以在包括3D扬声器布局的任意扬声器布局中稍后进行再现的新的编码技术和解码技术的实施例,其中,解决了上述问题中的全部或部分问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比国际公司,未经杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280073062.4/2.html,转载请声明来源钻瓜专利网。