[发明专利]使用量化和熵编码来编码或解码定向音频编码参数的装置和方法在审
申请号: | 201880086690.3 | 申请日: | 2018-11-16 |
公开(公告)号: | CN111656442A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 纪尧姆·福克斯;于尔根·赫勒;法比恩·屈希;斯蒂芬·朵拉;马库斯·马特拉斯;奥利弗·迪尔加特;奥利弗·维博尔特;弗罗林·吉多;斯特凡·拜尔;乌尔夫冈·雅吉斯 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/008 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 潘剑颖 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 量化 编码 解码 定向 音频 参数 装置 方法 | ||
一种用于编码包括扩散度参数和方向参数在内的定向音频编码参数的装置,该装置包括:参数量化器(210),用于量化扩散度参数和方向参数;参数编码器(220),用于编码经量化的扩散度参数和经量化的方向参数;以及输出接口(230),用于产生包括与经编码的扩散度参数和经编码的方向参数有关的信息的经编码的参数表示。
技术领域
本发明涉及音频信号处理,并且具体涉及诸如DirAC元数据之类的定向音频编码参数的有效编码方案。
背景技术
本发明旨在提出用于来自由定向音频编码(DirAC)(一种用于空间音频处理的感知激励技术)进行的3D音频场景分析的编码空间元数据的低比特率编码解决方案。
发送三维的音频场景需要处理多个声道,这通常引起发送大量数据。定向音频编码(Directional Audio Coding;DirAC)技术[1]是用于分析音频场景并以参数方式对其进行表示的有效方法。DirAC基于针对每个频带测量的到达方向(DOA)和扩散度来使用声场的感知激励表示。其是依据如下假设来建立的:在一个时刻并且对于一个临界频带,听觉系统的空间分辨率限于针对方向解码一个提示并且针对耳间相干性解码另一提示。然后通过使两个流(即非定向扩散流和定向不扩散串流)交叉衰落来在频域中再现空间声音。
本发明公开了基于DirAC声音表示和再现的3D音频编码方法来实现低比特率下的沉浸式音频内容的传输。
DirAC是感知激励空间声音再现。假设在一个时刻并且对于一个临界频带,听觉系统的空间分辨率限于针对方向解码一个提示并且针对耳间相干性解码另一提示。
基于这些假设,DirAC通过使两个流(即非定向扩散流和定向不扩散串流)交叉衰落来在一个频带中表示空间声音。DirAC处理在如下两个阶段中执行:如图10a和图10b中所描绘的分析阶段和合成阶段。
在DirAC分析阶段中,具有B格式的一阶重合麦克风被视为输入并且在频域中分析声音的扩散度和到达方向。
在DirAC合成阶段中,声音被分成两个流,即不扩散流和扩散流。使用幅度平移将不扩散流再现为点源,可以通过使用向量基幅度平移(VBAP)[2]来进行幅度平移。扩散流负责环绕感的感觉并且通过将彼此去相关的信号输送给扬声器而产生。
DirAC参数(在下文中也称为空间元数据或DirAC元数据)由扩散度和方向的元组组成。方向可以通过两个角度(方位角和仰角)以球形坐标来表示,而扩散度是位于0与1之间的标量因子。
图10a示出了接收B格式输入信号的滤波器组130。执行能量分析132和强度分析134。执行在136处指示的能量结果的时间平均和在138处指示的强度结果的时间平均,并且根据平均数据,如110处所指示地计算各个时间段/频段的扩散度值。通过框120来计算由滤波器组130的时间或频率分辨率给定的时间段/频段的方向值。
在图10b中所示的DirAC合成中,再次使用分析滤波器组431。例如,应用虚拟麦克风处理框421,其中虚拟麦克风与例如5.1扬声器装置的扬声器位置相对应。扩散度元数据由用于扩散度的对应的处理框422和由框423处指示的向量基幅度平移(VBAP)增益表来处理。扬声器平均框424被配置为执行增益平均,并且对应的归一化框425被应用以便在各个最终扬声器信号中具有对应的定义的响度等级。在框426中执行麦克风补偿。
所得信号一方面用于产生包括去相关阶段的扩散流427,并且另外也产生不扩散流428。针对对应的子带在加法器429中使两个流相加,并且在框431中,执行与其他子带的相加(即,频率到时间转换)。因此,框431也可以被视为合成滤波器组。对于来自特定扬声器装置的其他声道进行类似的处理操作,其中对于不同声道,框421中的虚拟麦克风的设定将是不同的。
在DirAC分析阶段中,具有B格式的一阶重合麦克风被视为输入并且在频域中分析声音的扩散度和到达方向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880086690.3/2.html,转载请声明来源钻瓜专利网。