[发明专利]改进解码用实际三维声内容的子频带中的处理在审
申请号: | 201780079018.7 | 申请日: | 2017-12-15 |
公开(公告)号: | CN110301003A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 马修·巴奎;亚历山大·格汗 | 申请(专利权)人: | 奥兰治公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L21/0272;H04S3/00;H04S3/02 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 南霆;李有财 |
地址: | 法国*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 三维 解码 声分量 解码矩阵 子矩阵 计算机装置 矩阵 尺寸缩减 频率过滤 应用结果 子频带 多阶 声源 重构 编译 传输 改进 应用 | ||
本发明涉及一种由计算机装置实施,用于处理包括定义一系列三维声频道的多阶的多个三维声分量的三维声内容的方法,其中每个三维声频道都表示三维声分量,方法包括:‑在多个频带中三维声分量的频率过滤,‑编译三维声解码矩阵(B),‑处理三维声解码矩阵(B),以通过矩阵尺寸缩减,提取每个与三维声阶和三维声阶用频带相关的多个三维声解码子矩阵(B1,B2)‑解码子矩阵于每个被选择频带中三维声分量的分别应用,以及所述相应应用结果的逐带重构,以传输多个解码的信号,每个解码的信号与声源相关。
技术领域
本发明涉及音频或声频信号处理领域,更具体地说,涉及环绕声格式(或下文中的“三维声”)中的实际多频道声音内容的处理。
背景技术
三维声技术包括在每个频带中使用寻求指向性特征的频道子集。作为应用示例,可以提及:
-声源分离:
o用于娱乐(卡拉OK:语音压缩);
o用于音乐(混合多频道内容中的分离源);
o用于电信(语音增强,噪声抑制);
o用于家庭自动化(语音控制);
o多频道音频编码。
-多频道扩散的解码:
o用于电影院;
o用于音乐;
o用于虚拟现实。
三维声包括保护球谐函数基的声场(图1中所示的基),以获得声场的空间性代表。函数是阶m和指数nσ的球谐,取决于球面坐标(θ,φ),,由下列公式定义:
其中,是涉及勒记德多项式的极性函数:
对于n≥1时,∈0=1和∈0=2
和
如图1所示,球谐振基的第一“矢量”(图1中的顶部)对应于阶m=0,下列行中的三个“矢量”对应于阶m=1(根据空间三个方向定向)等等。
在实践中,使用通常球状分布的传感器网络进行实际三维声编码,传感器的组合方式是为了合成频道最能符合球函数方向性的三维声内容(如图2所示)。参考图2,扩音器MIC包括根据空间到达各种方向接收声波的多个压电腔盒C1,C2.......。接收来自腔盒信号的处理单元UT,使用下文所述过滤器矩阵执行三维声编码,并传输三维声信号(图1所示类型的球函数基中形式化)。
发明内容
下文将描述三维声编码的基本原理。
三维声形式化,最初仅限于阶1球谐函数的代表,随后延伸到更高阶。具有较高分量数的三维声形式化,通常称为“高阶三维声”(或下文中的“HOA”)。
对于每个阶,m对应2m+1球谐函数,如图1所示。因此,阶M内容包含共计(M+1)2个频道(4个有阶1的频道,9个有阶2的频道,16个有阶3的频道,以此类推)。
下文中所述的术语“三维声分量”,表示每个三维声频道中的三维声信号,参考可能由每个球谐函数形成的矢量基中的“矢量分量”。因此,例如,可计算:
-一个三维声分量,对于阶m=0;
-三个三维声分量,对于阶m=1,
-五个三维声分量,对于阶m=2,
-七个三维声分量,对于阶m=3等等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奥兰治公司,未经奥兰治公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780079018.7/2.html,转载请声明来源钻瓜专利网。