[发明专利]用于对音频信号进行处理的方法、装置和设备在审
申请号: | 202010914886.6 | 申请日: | 2016-03-02 |
公开(公告)号: | CN112002337A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | D·S·麦克格拉斯 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;H04S3/00 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 宿小猛 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 音频 信号 进行 处理 方法 装置 设备 | ||
本公开涉及用于对音频信号进行处理的方法、装置和设备。一些方法涉及接收包括N个输入音频声道的输入音频信号,输入音频信号表示具有第一声场格式分辨率的第一声场格式,N是≥2的整数。可以将第一解相关过程应用于输入音频声道中的两个或更多个输入音频声道以产生第一组解相关的声道,第一解相关过程维持该组输入音频声道的声道间相关性。可以将第一调制过程应用于第一组解相关的声道以产生第一组解相关的且经调制的输出声道。可以将第一组解相关的且经调制的输出声道与两个或更多个未解相关的输出声道组合以产生包括O个输出音频声道的输出音频信号,O个输出音频声道表示分辨率比第一声场格式相对较高的第二声场格式,O是≥3的整数。
本申请是申请号为201680011460.1、申请日为2016年3月2日、发明名称为“通过调制解相关进行的空间音频信号增强”的发明专利申请的分案申请。
相关申请的交叉引用
本申请要求2015年3月3日提交的美国临时申请No.62/127,613和2016年2月23日提交的美国临时申请No.62/298,905的优先权,其中每个申请全文通过引用并入本文。
技术领域
本发明涉及包括多个音频声道的音频信号的操控,具体地涉及用于从具有较低分辨率空间特性的输入音频信号创建具有高分辨率空间特性的音频信号的方法。
背景技术
多声道音频信号用于为终端收听者存储或传输收听体验,收听体验可以包括非常复杂的声学场景的印象。多声道信号可以承载使用数个常见约定来描述声学场景的信息,常见约定包括但不限于以下:
离散扬声器声道:音频场景可能已经被以某种方式渲染以形成扬声器声道,这些扬声器声道当在适当布置的扩音器上回放时创建期望声学场景的错觉。离散扬声器声道格式的示例包括如现今的许多声音格式中使用的立体声、5.1或7.1信号。
音频对象:音频场景可以被表示为一个或多个对象音频声道,这些对象音频声道当被收听者回放装备渲染时可以重新创建声学场景。在一些情况下,每个音频对象将伴随有元数据(隐式的或显式的),该元数据被渲染器用于将对象平移(pan)到收听者回放环境中的适当定位。音频对象格式的示例包括Dolby Atmos,其被用在蓝光盘上的丰富声轨和其他运动图像递送格式的输送中。
声场声道:音频场景可以用声场格式(共同包含一个或多个音频对象的一组两个或更多个音频信号)表示,其中每个对象的空间定位被以平移增益的形式编码在空间格式中。声场格式的示例包括高保真立体声(Ambisonics)和高阶高保真立体声(两者在本领域中都是众所周知的)。
本公开涉及遵照各种空间格式的多声道音频信号的修改。
声场格式
N声道声场格式可以由其平移函数PN(φ)限定。具体地说,G=PN(φ),其中G表示增益值的[N×1]列矢量,并且φ限定对象的空间定位。
因此,一组M个音频对象(o1(t),o2(t),…,oM(t))可以根据等式2被编码为N声道空间格式信号XN(t)(其中音频对象m定位于由φm限定的位置处):
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010914886.6/2.html,转载请声明来源钻瓜专利网。