[发明专利]音频对象编码和解码在审

专利信息
申请号: 201280053631.9 申请日: 2012-10-29
公开(公告)号: CN103890841A 公开(公告)日: 2014-06-25
发明(设计)人: J.G.H.科彭斯;A.W.J.奧门;L.M.范德科霍夫 申请(专利权)人: 皇家飞利浦有限公司
主分类号: G10L19/008 分类号: G10L19/008
代理公司: 中国专利代理(香港)有限公司 72001 代理人: 曹芳;汪扬
地址: 荷兰艾*** 国省代码: 荷兰;NL
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音频 对象 编码 解码
【说明书】:

技术领域

发明涉及音频对象编码和解码,并且特别地,但不排他地,涉及与MPEG SAOC (空间音频对象编码)标准兼容的音频对象编码和/或解码。

背景技术

多通道音频对于包括家庭影院和多通道音乐系统的许多不同应用是普遍的并且已变得流行。音频编码常常被用来生成提供音频信号的高效数据表示的数据流。这样的音频编码允许音频信号的高效存储和分布。许多不同的音频编码标准已被开发以用于传统单声道和立体声音频信号二者的编码和解码,以及用于多通道音频信号的编码和解码。术语多通道此后被用来指两个以上的通道。专用音频标准的使用允许许多不同的系统、设备及应用之间的互工作和兼容性,并且因此遵守高效标准是关键的。然而,当新的标准被开发或者现有标准被修改时会出现一个重要问题。具体地,对标准的修改不仅可能实施起来费时且棘手而且还可能导致现有装备不适合于新的标准或实际上不适合于现有标准。为了促进新的标准或标准修改的引入,期望要求对现有标准做尽可能少的修改。在一些情况下甚至可能做出与现有标准完全兼容的修改,即能够在对现有标准规范没有任何改变的情况下应用修改。这个的示例是比特流水印。在比特流水印中特定比特流元素以兼容的方式被修改使得仍然能够根据标准规范解码比特流。尽管输出已改变,但是质量中的差异一般不可听。

MPEG环绕是多通道音频编码中的主要进展之一并且最近由运动图像专家组在ISO/IEC 23003-1中标准化。MPEG环绕是允许现有基于单声道或立体声的服务被扩展到多通道应用的多通道音频编码工具。图1示出了扩展有MPEG环绕的立体声核心编码器的框图。首先MPEG环绕编码器从多通道输入信号创建立体声下混合。接下来,从多通道输入信号估计空间参数。这些参数被编码到MPEG环绕比特流中。立体声下混合使用核心编码器(例如HE-AAC)而被编码成比特流。结果得到的核心编码器比特流和空间比特流被合并以创建总体比特流。典型地,空间比特流被包含在核心编码器比特流的辅助数据或用户数据部分中。在解码器侧核心比特流和空间比特流被分离。立体声核心比特流被解码以便重现立体声下混合。该下混合连同空间比特流一起被输入到MPEG环绕解码器。空间比特流被解码来提供空间参数。空间参数然后被用来对立体声下混合进行上混合以便获得多通道输出信号。

因为多通道输入信号的空间图像被参数化,所以MPEG环绕允许将相同的多通道比特流解码到除多通道扬声器装置以外的再现设备上。示例是耳机上的虚拟环绕重现,其被称为MPEG环绕双耳式解码过程。在这种模式下,能够使用常见的耳机提供逼真的环绕体验。图2示出了扩展有其中输出被解码为双耳式的MPEG环绕的立体声核心编解码器的框图。编码器过程与图1的编码器过程相同。在该系统中,空间参数与头部相关传递函数(HRTF)组合并且结果被用来产生所谓的双耳输出。

建立在MPEG环绕的构思之上,MPEG已标准化了用于各个音频对象的编码的系统。这个标准被称为“空间音频对象编码”(MPEG-D SAOC) ISO/IEC 23003-2。从高层角度看,SAOC高效地对声音对象而不是音频通道进行编码,其中每个声音对象可以典型地可以对应于声像中的单个声源。在MPEG环绕中,每个扬声器通道都能够被认为源自声音对象的不同混合,而在SAOC中数据是针对各个声音对象来提供的。类似于MPEG环绕,在SAOC中同样创建了单声道或立体声下混合。特别地,SAOC还生成使用诸如HE-AAC之类的标准下混合编码器编码的单声道或立体声下混合。以这种方式,传统回放设备将忽视参数数据并且播放单声道或立体声下混合,而SAOC解码器能够对信号进行上混合以便找回原始声音对象或者以便允许它们以期望的输出配置而被再现。对象和下混合参数被嵌入在下混合编码比特流的辅助数据部分中以便为各个SAOC对象提供相对电平和增益信息,典型地将这些的下混合反映到立体声/单声道下混合中。在解码器侧,用户能够通过操纵这些参数来控制各个对象的各种特征(诸如空间位置、放大以及均衡),或者用户能够对各个对象应用诸如混响之类的效果。

图3示出了针对常见SAOC编码的框图。SAOC编码器能够被认为是位于常规单声道或立体声编码器之前的预处理模块。预处理包括从数目N的对象信号生成立体声(或单声道)下混合。此外,对象参数被提取并且连同关于下混合矩阵M的信息一起存储在SAOC比特流中。在两种类型的参数中编码SAOC下混合信息。第一种DMG(下混合增益)参数指示应用于对象的增益。DCLD(下混合通道电平差)参数用信号发送对象在立体声下混合中的两个通道之上的分布。对每个对象都定义了这两个参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201280053631.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top