[发明专利]实现3D音频内容的SAOC降混合的装置及方法有效

申请号：	201480041327.1	申请日：	2014-07-16
公开（公告）号：	CN105593929B	公开（公告）日：	2020-12-11
发明（设计）人：	萨沙·迪克;哈拉尔德·福斯;奥立夫·赫尔穆特;于尔根·赫勒;艾德里安·穆尔塔扎;法尔科·里德布施;里昂·特伦蒂夫;约尼·鲍卢斯	申请（专利权）人：	弗朗霍夫应用科学研究促进协会
主分类号：	G10L19/008	分类号：	G10L19/008;H04S3/00
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	宋融冰
地址：	德国***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	实现音频内容 saoc 混合装置方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

提供了一种装置，用于产生一个或多个音频输出声道。该装置包含：参数处理器(110)，用于计算输出声道混合信息，以及降混合处理器(120)，用于产生该一个或多个音频输出声道。该降混合处理器(120)用于接收包含一个或多个音频传输声道的音频传输信号，其中两个或更多个音频对象信号被混合在该音频传输信号中，且其中该一个或多个音频传输声道的数量小于该两个或更多个音频对象信号的数量。该音频传输信号取决于第一混合规则以及第二混合规则。第一混合规则指示如何混合该两个或更多个音频对象信号以获得多个预混合声道。而且，第二混合规则指示如何混合该多个预混合声道以获得该音频传输信号的该一个或多个音频传输声道。该参数处理器(110)用于接收第二混合规则的信息，其中第二混合规则的信息指示如何混合该多个预混合信号，使得该一个或多个音频传输声道被获得。而且，该参数处理器(110)用于根据音频对象数量、预混合声道数量以及该第二混合规则的该信息，计算该输出声道混合信息，该音频对象数量指示该两个或更多个音频对象信号的该数量，该预混合声道数量指示该多个预混合声道的该数量。该降混合处理器(120)用于根据该输出声道混合信息从该音频传输信号产生该一个或多个音频输出声道。

技术领域

本发明涉及音频编码/解码，特别是涉及空间音频编码以及空间音频对象编码，以及更特别地涉及一种实现三维音频内容的SAOC降混合的装置及方法，以及一种三维音频内容的高效率解码该SAOC降混合的装置及方法。

现有技术

空间音频编码工具是此技术领域中所熟知的，例如，在环绕MPEG标准中已有标准化规范。空间音频编码从原始输入声道开始，例如在再现装备中依照其位置而识别的五个或七个声道，即左声道、中间声道、右声道、左环绕声道、右环绕声道以及低频增强声道。空间音频编码器通常从原始声道得到至少一个降混声道，以及另外得到关于空间线索的参数数据，例如声道间水平差异、声道间相位差异、声道间时间差异等等。至少一个降混声道与指示空间线索的参数化辅助信息(parametric side information，或称为参数边信息、参数侧信息或参数侧边信息)一起传送到空间音频解码器，空间音频解码器解码降混声道以及相关联的参数数据，最后获得为原始输入声道的近似版本的输出声道。声道在输出装备的放置通常为固定，例如，5.1声道格式或7.1声道格式等等。

此种基于声道的音频格式广泛使用于储存或者传送多声道音频内容，而每一个声道关于在给定位置的特定扬声器。这些种类格式的忠实再现，需要扬声器装备，其中扬声器放置在与音频信号生产期间使用的扬声器相同的位置。虽然增加扬声器数量可改进真实三维虚拟现实场景的再现，但是满足此要求是越来越困难的，尤其是在家庭环境中，像是客厅。

可用以对象为基础的方法来克服对特殊扬声器设备的需求，在以对象为基础的方法中扬声器信号特别针对回放装备来渲染。

例如，空间音频对象编码工具是此技术领域中所熟知的且在MPEG SAOC(SAOC＝spatial audio object coding空间音频对象编码)标准中已成标准。相比于空间音频编码从原始声道开始，空间音频对象编码从非自动专为特定渲染再现装备的音频对象开始。代替地，音频对象在再现场景中的位置可变化，且可由使用者通过将特定的渲染信息输入至空间音频对象编码解码器来确定。可选地或另外，渲染信息，即在再现装备中特定音频对象待放置的位置信息，以额外的辅助信息或元数据来传送。为了获得特定的数据压缩，由SAOC编码器来编码多个音频对象，SAOC编码器根据特定的降混合信息来降混合对象以从输入对象计算至少一个传输声道。此外，SAOC编码器计算参数化辅助信息，其代表对象间线索，例如对象水平差异(OLD)、对象相干数值等等。对象间参数数据针对参数时间平铺/频率平铺来计算，即，针对音频信号的特定帧(例如，1024或2048个样本)，考虑多个处理频带(例如28、20、14或10个处理频带等等)使得对于每一帧以及每一处理频带皆存在参数数据。作为举例，当音频片具有20个帧且当每一帧细分成28个处理频带，则时间/频率平铺的数量为560。

在以对象为基础的方法中，以分离式音频对象来描述音场。此需要对象元数据，其描述在3D空间中每一个声源的时变位置。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于弗朗霍夫应用科学研究促进协会，未经弗朗霍夫应用科学研究促进协会许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201480041327.1/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]实现3D音频内容的SAOC降混合的装置及方法有效

专利文献下载