[发明专利]用于编码空间音频表示的装置和方法以及用于使用传输元数据来解码经编码的音频信号的装置和方法,以及相关的计算机程序在审
申请号: | 202080010287.X | 申请日: | 2020-01-21 |
公开(公告)号: | CN113490980A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 法比恩·屈希;奥利弗·迪尔加特;吉洛姆·福赫斯;斯蒂芬·朵拉;亚历山大·布坦恩;于尔根·赫勒;斯特凡·拜尔 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 潘剑颖 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 编码 空间 音频 表示 装置 方法 以及 使用 传输 数据 解码 信号 相关 计算机 程序 | ||
一种用于对表示音频场景的空间音频表示进行编码以获得经编码的音频信号的装置,包括:传输表示发生器(600),用于根据空间音频表示生成传输表示(611),并且用于生成与传输表示(611)的生成有关或指示传输表示(611)的一个或多个方向属性的传输元数据(610);以及输出接口(640),用于生成经编码的音频信号,该经编码的音频信号包括与传输表示(611)有关的信息,以及与传输元数据(610)有关的信息。
技术领域
本发明的实施例涉及用于方向性音频编码的传输声道或下混信令。
背景技术
方向性音频编码(DirAC)技术[Pulkki07]是一种分析和再现空间声音的有效方法。DirAC使用基于空间参数的声场的感知激励表示,即每个频带测量的到达方向(DOA)和扩散度。它建立在如下假设之上:在某一时刻和一个临界频带,听觉系统的空间分辨率仅限于解码针对方向的一个线索和针对听觉间连贯性的另一个线索。然后通过交叉淡化如下两个流而在频域中表示空间声音:非方向性扩散流和方向性非扩散流。
DirAC最初旨在用于录制B格式声音,但也可以扩展为匹配特定扬声器设置(如5.1[2]或麦克风阵列的任何配置[5])的麦克风信号。在最新的情况下,通过录制不是针对特定扬声器设置的信号,而是录制中间格式的信号,可以实现更大的灵活性。
这种在实践中已经很好建立的中间格式由(高阶)高保真度立体声响复制(Ambisonics)[3]表示。根据Ambisonics信号,可以生成每个所需扬声器设置的信号,包括用于耳机再现的双耳信号。这需要应用到Ambisonics信号的特定渲染器,使用线性Ambisonics渲染器[3]或诸如方向性音频编码(DirAC)之类的参数渲染器。
Ambisonics信号可以表示为多声道信号,其中每个声道(称为Ambisonics分量)等效于所谓的空间基函数的系数。使用这些空间基函数的加权和(其中权重对应于系数),可以重建录制位置的原始声场[3]。因此,空间基函数系数(即,Ambisonics分量)表示对录制位置中的声场的简洁描述。存在不同类型的空间基函数,例如球谐函数(SphericalHarmonics,SH)[3]或柱谐函数(Cylindrical Harmonics,CH)[3]。可以在描述2D空间中的声场时使用CH(例如用于2D声音再现),而SH可用于描述2D和3D空间中的声场(例如用于2D和3D声音再现)。
例如,从某个方向到达的音频信号f(t)会产生空间音频信号该空间音频信号可以通过将球谐函数展开到截断阶数H来以Ambisonics格式表示:
其中是l阶和m模式的球谐函数,而φlm(t)是展开系数。随着截断阶数H的增加,展开导致更精确的空间表示。图1a中示出了对于n阶和m模式,具有Ambisonics声道编码(ACN)索引的高达H=4阶的球面谐波。
DirAC已经扩展用于根据一阶Ambisonics信号(FOA,称为B格式)或根据不同麦克风阵列[5]提供更高阶的Ambisonics信号。本文献重点介绍一种根据DirAC参数和参考信号合成更高阶Ambisonics信号的更有效的方法。在本文献中,参考信号(也称为下混信号)被认为是更高阶Ambisonics信号的子集或Ambisonics分量的子集的线性组合。
在DirAC分析中,根据音频输入信号估计DirAC的空间参数。最初,DirAC是为一阶Ambisonics(FOA)输入而开发的,该FOA输入可以例如从B格式麦克风获得,然而其他输入信号也是可能的。在DirAC合成中,根据DirAC参数和相关联的音频信号来计算用于空间再现的输出信号,例如扬声器信号。已经描述了仅将全向音频信号用于合成或使用整个FOA信号的解决方案[Pulkki07]。备选地,仅四个FOA信号分量的子集可用于合成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080010287.X/2.html,转载请声明来源钻瓜专利网。