[发明专利]将降混音频信号升混的装置、方法与计算机程序有效

专利信息
申请号: 201080005944.8 申请日: 2010-01-12
公开(公告)号: CN102301420A 公开(公告)日: 2011-12-28
发明(设计)人: 马帝斯·纽辛格;茱莉安·罗比莱德;乔哈那斯·希尔皮特 申请(专利权)人: 弗劳恩霍弗实用研究促进协会
主分类号: G10L19/00 分类号: G10L19/00;H04B1/66
代理公司: 北京泰吉知识产权代理有限公司 11355 代理人: 张雅军
地址: 德国*** 国省代码: 德国;DE
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 将降混 音频 信号 装置 方法 计算机 程序
【说明书】:

技术领域

根据本发明的实施例有关于将降混(downmix)音频信号升混(upmix)的一装置、一方法及一计算机程序。

根据本发明的一些实施例是有关于参数多声道音频编码的一幅度保持的升混参数内插。

背景技术

在下文中,将描述本发明的背景。近来参数音频编码领域的发展实现了将一多声道音频(例如5.1)信号联合地编码为一(或多个)降混声道及一旁侧信息流的技术。已知这些技术为双耳线索编码(Binaural Cue Coding)、参数立体声(Parametric Stereo)及MPEG环绕(MPEG Surround)等。

多个出版物描述了所谓“双耳线索编码”的参数多声道编码方式,例如参见参考文献[1][2][3][4][5]。

“参数立体声”是基于一所发送的单音信号及参数旁侧信息,用以参数编码一个双声道立体声信号的相关技术[6][7]。

“MPEG环绕”是参数多声道编码的一ISO标准[8]。

上述技术是基于将人类空间听力的相关感知线索以压缩的形式,与相关联的单音降混信号或立体声降混信号一起发送至接收器。典型的线索可以是声道间电平差(ILD)、声道间相关性或相干性(ICC)、以及声道间时间差(ITD)与声道间相位差(IPD)。

这些参数在一些情况下,以适用于人类听觉分辨率的频率及时间分辨率来发送。更新的时间间隔,根据信号特性,由编码器来判定。这意味着不会对降混信号中的每一样本,进行参数传输。换句话说,在一些情况下,描述上述线索之参数的传输率(或传输频率或更新率)可能小于音频样本(或音频样本群组)的传输率(或传输频率或更新率)。

因为在一些情况下,解码器可能必须以无间隙的方式,随着时间的推移连续地应用该等参数,例如将该等参数应用于每一样本(或音频样本),所以中间参数可能需要典型地通过内插于过去和目前参数组之间,而在解码器侧推导出。

然而,一些习用的内插方式会导致差的音频品质。

在下文中,一般的双耳线索编码方案将参照图7来描述。图7显示一双耳线索编码传输系统800的一方块示意图,其包含一双耳线索编码的编码器810及一双耳线索编码的解码器820。该双耳线索编码的编码器810可以接收多个音频信号例如812a、812b及812c。而且,双耳线索编码的编码器810被组配以使用一降混器814,将音频输入信号812a-812c降混,而获得一降混信号816,其可以例如是一总和信号,且可以由“AS”或“X”表示。而且,双耳线索编码的编码器810被组配以使用一分析器818来分析音频输入信号812a-812c,而获得旁侧信息信号819(“SI”)。总和信号816及旁侧信息信号819从该双耳线索编码的编码器810发送至双耳线索编码的解码器820。双耳线索编码的解码器820可被组配以在总和信号816及声道间线索824的基础上,合成包含例如音频声道y1、y2、...、yN的一多声道音频输出信号。以此为目的,双耳线索编码的解码器820可包含接收总和信号816及声道间线索824,且提供音频信号y1、y2、...、yN的一双耳线索编码合成器822。

双耳线索编码的解码器820还包含被组配以接收旁侧信息819,且可取舍地接收一使用者输入827的一旁侧信息处理器826。旁侧信息处理器826被组配以在旁侧信息819及可取舍的使用者输入827的基础上,提供声道间线索824。

概括地说,音频输入信号获得分析且被降混。总和信号及旁侧信息被发送至解码器。声道间线索由旁侧信息及本地使用者输入来产生。双耳线索编码合成器产生多声道音频输出信号。

详情请参照由C.Faller与F.Baumgarte所著的论文“Binaural Cue Coding Part II:Schemes and applications”(刊登于:IEEE Transactions on Speech and Audio Processing,卷11,第6号,2003年11月)。

然而,已经发现的是,如果接收的旁侧信息的更新频率比降混信号的更新频率低,许多习用的双耳线索编码的解码器提供质量降低的多声道输出音频信号。

考虑到此问题,如果旁侧信息的更新频率小于降混音频信号的更新频率,需要引入把一降混音频信号升混为一升混后的音频信号的改良概念,这会减小听力印象的降级。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍弗实用研究促进协会,未经弗劳恩霍弗实用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201080005944.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top