[发明专利]用于生成和交互式地渲染基于对象的音频的方法和系统有效

专利信息
申请号: 201710942931.7 申请日: 2014-04-03
公开(公告)号: CN107731239B 公开(公告)日: 2022-04-15
发明(设计)人: 斯里巴拉·S·梅赫塔;托马斯·齐格勒;贾尔斯·贝克;杰弗里·里德米勒;普林亚尔·桑索姆布 申请(专利权)人: 杜比实验室特许公司;杜比国际公司
主分类号: G10L19/008 分类号: G10L19/008;G10L19/20;H04S7/00;G10L19/16
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 杜诚;李德山
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 用于生成基于对象的音频节目的方法,该基于对象的音频节目是以可个性化的方式可渲染的,并且包括在不选择其他节目内容的情况下可渲染的扬声器通道声床(例如,以提供默认的全范围音频体验)。其他实施方式包括递送、解码和/或渲染这样的节目的步骤。声床的内容的渲染或者节目的其他内容的所选的混音的渲染可以提供沉浸式体验。节目可以包括多个对象通道(例如,指示用户可选的和用户可配置的对象的对象通道)、扬声器通道声床和其他扬声器通道。另一方面是音频处理单元(例如,编码器或解码器),其被配置成执行方法的任意实施方式,或者其包括存储根据方法的任意实施方式生成的基于对象的音频节目(或其比特流)的至少一个帧(或其他分段)的缓冲存储器。
搜索关键词: 用于 生成 交互式 渲染 基于 对象 音频 方法 系统
【主权项】:
一种用于生成指示音频内容的基于对象的音频节目的方法,所述音频内容包括第一非环境内容、与所述第一非环境内容不同的第二非环境内容以及与所述第一非环境内容和所述第二非环境内容不同的第三内容,所述方法包括步骤:确定包括N个对象通道的对象通道组,其中所述对象通道组的第一子组指示所述第一非环境内容,所述第一子组包括所述对象通道组中的M个对象通道,N和M中的每个是大于零的整数,并且M等于或小于N;确定指示音频内容的默认混音的扬声器通道声床,其中包括所述声床中的M个扬声器通道的基于对象的扬声器通道子组指示所述第二非环境内容、或所述默认混音的所述第二非环境内容与所述默认混音的所述音频内容中的至少一些其它音频内容的混音;确定一组M个替换扬声器通道,其中,所述一组M个替换扬声器通道中的每个替换扬声器通道不指示所述基于对象的扬声器通道子组中的相应扬声器通道的内容,或指示所述基于对象的扬声器通道子组中的相应扬声器通道的一些而非全部的内容;生成元数据,所述元数据指示所述对象通道中的至少之一的内容与所述声床的所述扬声器通道和/或所述替换扬声器通道中的预定扬声器通道的内容的至少一个可选的预定备选混音,其中所述元数据包括针对每个所述备选混音的渲染参数,并且至少一个所述备选混音是指示所述声床的至少一些音频内容和所述第一非环境内容而非所述第二非环境内容的替换混音;以及生成包括所述扬声器通道声床、所述一组M个替换扬声器通道、所述对象通道组和所述元数据的所述基于对象的音频节目,使得在不使用所述元数据的情况下,所述扬声器通道声床是能够渲染的,以提供能被感知为所述默认混音的声音,以及所述替换混音是能够响应于至少一些所述元数据来渲染的,以提供能被感知为包括所述声床的所述至少一些音频内容和所述第一非环境内容而非所述第二非环境内容的混音的声音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司;杜比国际公司,未经杜比实验室特许公司;杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710942931.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top