[发明专利]基于声输入信号提供空间参数的空间音频处理器和方法有效

专利信息
申请号: 201180026742.6 申请日: 2011-03-16
公开(公告)号: CN102918588A 公开(公告)日: 2013-02-06
发明(设计)人: 奥利弗·蒂尔加特;法比安·库奇;理查德·舒尔茨-阿姆林;马库斯·卡琳格尔;乔瓦尼·德尔加尔多;阿希姆·昆茨;迪尔克·玛赫内;维莱·普尔基;米科-维莱·雷蒂嫩 申请(专利权)人: 弗兰霍菲尔运输应用研究公司
主分类号: G10L19/008 分类号: G10L19/008
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 余刚;吴孟秋
地址: 德国*** 国省代码: 德国;DE
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 输入 信号 提供 空间 参数 音频 处理器 方法
【说明书】:

技术领域

发明的实施方式创建了一种用于基于声输入信号来提供空间参数的空间音频处理器。本发明的其他实施方式创建了一种用于基于声输入信号来提供空间参数的方法。本发明的实施方式可涉及例如基于麦克风录音的空间声音的声学分析、参数化描述和再现的领域。

背景技术

空间声音记录目的在于利用多个麦克风捕获声场,使得在再现一侧,当声像存在于记录位置处时,听众能感知声像。用于空间声音记录的标准方法使用简单立体声麦克风或更复杂的定向麦克风组合,例如,诸如用在立体混响中的B格式麦克风。通常,这些方法被称为同步麦克风技术。

可替代地,可应用基于声场的参数再现的方法,该方法被称为参数空间音频处理器。近来,已提出针对空间音频的分析、参数化描述和再现的几种技术。各系统关于参数化描述的类型、所需输入信号的类型、与具体扬声器设置的相关性和无关性等具有独特优势和缺陷。

用于空间声音的有效参数化描述的一个实例由定向音频编码(DirAC)给出(V.Pulkki:Spatial Sound Reproduction with Directional AudioCoding,Journal of the AES,Vol.55,No.6,2007)。DirAC表示用于空间声音的声学分析和参数化描述(DirAC分析)以及用于其再现(DirAC合成)的方法。DirAC分析采用多个麦克风信号作为输入。以一个或几个下混音频信号和包括声音方向和扩散度的参数侧信息的形式为多个频率子带提供空间声音的描述。扩散度参数描述了所记录的声场如何扩散。此外,扩散度可被用作对方向估计的可靠性测量。另一应用由空间音频信号的方向相关处理构成(M.Kallinger et al.:A Spatial Filtering Approach forDirectional Audio Coding,126th AES Convention,Munich,May 2009)。基于参数化表示,可利用任意扬声器设置来再现空间音频。此外,DirAC分析可被视为参数化编码系统的声学前端,该参数化编码系统的声学前端能够编码、传输和再现多信道空间音频,例如MPEG环绕。

空间声场分析的另一方法由所谓的空间音频麦克风(SAM)来表示(C.Faller:Microphone Front-Ends for Spatial Audio Coders,in Proceedingsof the AES 125th International Convention,San Francisco,Oct.2008)。SAM采用同步定向麦克风的信号作为输入。与DirAC类似,SAM连同扩散声音分量的估计一起来确定用于声场的参数化描述的声音DOA(DOA-波达方向)。

用于空间音频的记录和分析的参数化技术(诸如DirAC和SAM)依赖于对具体声场参数的估计。因此,这些方法的性能强烈取决于空间隐含参数(诸如声音的波达方向或声场扩散度)的估计性能。

一般地,当估计空间隐含参数时,可对声输入信号(例如,对稳定性或者对音调)作出特定假设,以采用用于音频处理的最佳(即,最有效或最准确)算法。传统上,为此可定义单个时间不变信号模型。然而,通常出现的问题是不同音频信号可能表现出极为瞬时的变化,使得描述音频输入的通用的时间不变模型经常不充分。尤其是当考虑用于处理音频的单个时间不变信号模型时,可能发生模型失配,这降低了所应用的算法的性能。

本发明的实施方式的目的在于提供用于具有由声输入信号的瞬时变化或瞬时非稳定引起的较低模型失配的声输入信号的空间参数。

发明内容

该目的由根据权利要求1所述的空间音频处理器、根据权利要求14所述的用于基于声输入信号来提供空间参数的方法以及根据权利要求15所述的计算机程序来解决。

本发明的实施方式创建了一种用于基于声输入信号来提供空间参数的空间音频处理器。空间音频处理器包括信号特性确定器和可控参数估计器。信号特性确定器被配置为确定声输入信号的信号特性。可控参数估计器被配置为根据可变空间参数计算规则来计算针对声输入信号的空间参数。参数估计器还被配置为根据所确定的信号特性来修改可变空间参数计算规则。

本发明的实施方式的思想在于当基于声输入信号的信号特性来修改用于计算空间参数的计算规则时,可创建用于基于声输入信号来提供空间参数的空间音频处理器,该空间音频处理器减小了由声输入信号的瞬时变化引起的模型失配。已发现当确定声输入信号的信号特性时,可减小模型失配,并基于所确定的信号特性来计算用于声输入信号的空间参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗兰霍菲尔运输应用研究公司,未经弗兰霍菲尔运输应用研究公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201180026742.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top