[发明专利]用于空间音频对象编码中信号相依缩放变换的编码器、解码器及方法有效

申请号：	201380052362.9	申请日：	2013-10-02
公开（公告）号：	CN104798131B	公开（公告）日：	2018-09-25
发明（设计）人：	萨沙·迪施;约尼·鲍卢斯;贝恩德·埃德勒;奥立夫·赫尔穆特;于尔根·赫勒;索尔斯腾·科斯特	申请（专利权）人：	弗朗霍夫应用科学研究促进协会
主分类号：	G10L19/025	分类号：	G10L19/025;G10L19/008;G10L19/02;G10L19/20
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	宋融冰
地址：	德国***	国省代码：	德国;DE
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于空间音频对象编码信号相依缩放变换编码器解码器方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

提供一种用于从降混信号产生包括一个或多个音频输出声道的音频输出信号的解码器。降混信号编码一个或多个音频对象信号。解码器包括用于根据一个或多个音频对象信号中的至少一个的信号属性将激活指示设定成激活状态的控制单元(181)。此外，解码器包括用于变换解混信号以获得包括多个第一子带声道的第一变换后的降混的第一分析模块(182)。此外，解码器包括第二分析模块(183)，用于当激活指示被设定成激活状态时，通过变换第一子带声道中的至少一个获得第二子带声道而产生第二变换后的降混，其中第二变换后的降混包括尚未被第二分析模块变换的第一子带声道及第二子带声道。此外，解码器包括解混单元(184)，其中解混单元(184)用于当激活指示被设定成激活状态时，基于关于一个或多个音频对象信号的参数边信息对第二变换后的降混进行解混以获得音频输出信号，以及当激活指示未被设定成激活状态时，基于关于一个或多个音频对象信号的参数边信息度第一变换后的降混进行解混以获得音频输出信号。此外，提供一种编码器。

技术领域

本发明涉及音频信号编码、音频信号解码及音频信号处理，特别地，涉及一种用于空间音频对象编码(SAOC)中时间/频率分辨率的反向兼容动态适应的编码器、解码器及方法。

背景技术

在现代数字音频系统中，允许在接收器侧上对所传输的内容进行与音频对象有关的修改为主要趋势。这些修改包括音频信号的选定部分的增益修改和/或通过空间分布式扬声器在多声道回放的情况下对专用音频对象的空间重定位。这可通过分别地将音频内容的不同部分传递至不同扬声器来实现。

换言之，在音频处理、音频传输及音频存储的技术中，存在允许关于面向对象式音频内容播放的用户交互的增加需求，以及存在利用多声道播放的扩展可能性分别地渲染音频内容或其部分以便改善听觉印象的要求。由此，多声道音频内容的使用为用户带来显著的改善。例如，可获得三维听觉印象，其在娱乐应用中带来改善的用户满意度。然而，多声道音频内容也适用于专业环境，例如，电话会议应用，因为通过使用多声道音频播放可以改善讲话者的可懂度。另一可能应用为使得音乐作品的收听者分别地调整不同部分(也称为“音频对象”)或乐曲(诸如，声乐部分或不同乐器)的播放级别和/或空间位置。使用者可因为个人品味、为了更易于转录来自音乐作品的一个或多个部分、教育目的、伴唱、排演等原因而执行这种调整。

所有数字多声道或多对象音频内容的直接离散传输(例如，脉冲编码调制(PCM)数据的形式或者甚至压缩音频格式)需要非常高的比特率。然而，也需要按比特率有效的方式传输及存储音频数据。因此，人们乐于接受音频质量与比特率要求之间的合理权衡以便避免由多声道/多对象应用造成的过多资源负荷。

近来，在音频编码的领域中，用于多声道/多对象音频信号的比特率有效传输/存储的参数技术已由例如运动图像专家组(MPEG)及其他人介绍。一个示例为作为面向声道的方法[MPS、BCC]的MPEG环绕(MPS)，或作为面向对象的方法[JSC、SAOC、SAOC1、SAOC2]的MPEG空间音频对象编码(SAOC)。另一面向对象的方法被称为“知情源分离(informed sourceseparation)”[ISS1、ISS2、ISS3、ISS4、ISS5、ISS6]。这些技术旨在基于声道/对象与额外边信息(描述传输/存储的音频场景和/或音频场景中的音频源对象)的降混重建期望的输出音频场景或期望的音频源对象。

按时频选择性方式在这种系统中进行声道/对象相关的边信息的估计及应用。因此，这种系统使用时频变换，诸如，离散傅立叶变换(DFT)、短时傅立叶变换(STFT)或滤波器组如正交镜相滤波器(QMF)组等。使用MPEG SAOC的示例，在图3中描述这种系统的基本原理。

在STFT的情况下，时间维度由时间块号码表示，空间维度由频谱系数(“仓”号)捕获。在QMF的情况下，时间维度由时槽号码表示，空间维度由子带号码捕获。如果QMF的空间分辨率被随后应用的第二滤波器阶段改善，则将整个滤波器组称为混合QMF，且将精细分辨率子带称为混合子带。

如上所述，在SAOC中，按时频选择性方式进行一般的处理，且可如下在每个频带内描述，如图3中所示：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于弗朗霍夫应用科学研究促进协会，未经弗朗霍夫应用科学研究促进协会许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201380052362.9/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于空间音频对象编码中信号相依缩放变换的编码器、解码器及方法有效

专利文献下载