[发明专利]一种近场双耳渲染方法、系统及可读存储介质有效

专利信息
申请号: 201780050265.4 申请日: 2017-06-16
公开(公告)号: CN109891502B 公开(公告)日: 2023-07-25
发明(设计)人: E·斯特因;M·沃尔什;石光霁;D·科尔塞洛 申请(专利权)人: DTS公司
主分类号: G10L19/00 分类号: G10L19/00;H04R5/00;H04S1/00;H04S3/00;H04S5/02;H04S7/00
代理公司: 中国贸促会专利商标事务所有限公司 11038 代理人: 宿小猛
地址: 美国加*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 近场 渲染 方法 系统 可读 存储 介质
【说明书】:

本文描述的方法和装置最佳地将全3D音频混合(例如,方位角、仰角和深度)表示为“声音场景”,其中解码处理促进头部跟踪。能够针对收听者的朝向(例如,偏航、俯仰、滚动)和3D位置(例如,x、y、z)修改声音场景渲染。这提供了将声音场景源位置视为3D位置而不是限制于相对于收听者的位置的能力。本文讨论的系统和方法能够在任何数量的音频声道中完全表示此类场景,以提供与通过诸如DTS HD之类的现有音频编解码器的传输的兼容性,但是携带比7.1声道混合实质上更多的信息(例如,深度、高度)。

相关申请和优先权要求

本申请涉及并要求于2016年6月17日提交的标题为“Systems and Methods forDistance Panning using Near And Far Field Rendering”的美国临时申请No.62/351,585的优先权,该申请的全部内容通过引用并入本文。

技术领域

专利文件中描述的技术涉及关于在声音再现系统中合成空间音频的方法和装置。

背景技术

几十年来,空间音频再现引起了音频工程师和消费电子行业的兴趣。空间声音再现需要双声道或多声道电-声系统(例如,扬声器、耳机),其必须根据应用(例如,音乐会表演、电影院、家庭高保真音响设备、计算机显示器、单独的头戴式显示器)的上下文来配置,这在通过引用并入本文的Jot,Jean-Marc的“Real-time Spatial Processing of Soundsfor Music,Multimedia and Interactive Human-Computer Interfaces”IRCAM,1PlaceIgor-Stravinsky 1997,(下文称为“Jot,1997”)中进一步描述。

用于电影和家庭视频娱乐业的音频记录和再现技术的发展已经导致各种多声道“环绕声”记录格式(最值得注意的是5.1和7.1格式)的标准化。已经开发出了各种音频记录格式用于编码记录中的三维音频线索。这些3-D音频格式包括Ambisonics和包括升高的扬声器声道的离散多声道音频格式,诸如NHK 22.2格式。

下混被包括在各种多声道数字音频格式的声轨数据流中,诸如来自加利福尼亚州卡拉巴萨斯(Calabasas)的DTS公司的DTS-ES和DTS-HD。这种下混是向后兼容的,并且可以由遗留解码器解码并在现有回放装备上再现。这种下混包括数据流扩展,其携带被遗留解码器忽略但可以被非遗留解码器使用的附加音频声道。例如,DTS-HD解码器可以恢复这些附加声道,减去它们在向后兼容的下混中的贡献,并且以与向后兼容格式不同的目标空间音频格式渲染它们,该目标空间音频格式可以包括升高的扬声器位置。在DTS-HD中,在向后兼容的混合中和在目标空间音频格式中附加声道的贡献由混合系数的集合(例如,每个扬声器声道一个)来描述。在编码阶段指定声轨所针对的目标空间音频格式。

这种方法允许以与遗留环绕声解码器兼容的数据流的形式和在编码/生产阶段期间也选择的一个或多个替代目标空间音频格式来编码多声道音频声轨。这些替代目标格式可以包括适合于改进的三维音频线索的再现的格式。但是,这个方案的一个限制是,为另一个目标空间音频格式编码相同的声轨需要返回到生产设施,以便记录和编码为新格式混合的声轨的新版本。

基于对象的音频场景编码提供独立于目标空间音频格式的声轨编码的通用解决方案。基于对象的音频场景编码系统的示例是用于场景的MPEG-4高级音频二进制格式(AABIFS)。在这种方法中,每个源信号与渲染线索数据流一起单独发送。这个数据流携带空间音频场景渲染系统的参数的时变值。可以以格式无关的音频场景描述的形式提供这个参数集,使得可以通过根据这种格式设计渲染系统来以任何目标空间音频格式渲染声轨。每个源信号结合其相关联的渲染线索,定义“音频对象”。这种方法使得渲染器能够实现最准确的空间音频合成技术,该技术可用于以在再现端选择的任何目标空间音频格式渲染每个音频对象。基于对象的音频场景编码系统还允许在解码阶段对渲染的音频场景进行交互式修改,包括重新混合、音乐重新解释(例如,卡拉OK)或场景中的虚拟导航(例如,视频游戏)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于DTS公司,未经DTS公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201780050265.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top