[发明专利]使用相位值平滑对下混频音频信号进行上混频的装置、方法和计算机程序有效
申请号: | 201310120468.X | 申请日: | 2010-04-01 |
公开(公告)号: | CN103325374B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 马蒂亚斯·诺伊辛格;朱利安·罗比亚尔;约翰内斯·希尔珀特 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 王波波 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 相位 平滑 混频 音频 信号 进行 装置 方法 计算机 程序 | ||
本申请是申请日为2010年4月1日的中国专利申请201080003595.6(使用相位值平滑对下混频音频信号进行上混频的装置、方法和计算机程序)的分案申请。
技术领域
根据本发明的实施例涉及一种用于对下混频音频信号进行上混频的装置、方法和计算机程序。
根据本发明的一些实施例涉及参数多声道音频编码的自适应相位参数平滑。
背景技术
下面将描述本发明的背景。参数音频编码领域中的新近发展发表了将多声道音频(例如,5.1)信号联合编码成一个(或一个以上)下混频声道加辅助信息流的技术。这些技术被称为双耳提示编码(Binaural Cue Coding)、参数立体声、及MPEG环绕等等。
许多出版物描述了所谓的“双耳提示编码”参数多声道编码方法,例如见参考文献[1][2][3][4][5]。
“参数立体声」”是一种基于传输的单声道信号加参数辅助信息的双声道立体声信号的参数编码的相关技术,例如见参考文献[6][7]。
“MPEG环绕”是参数多声道编码的ISO标准,例如见参考文献[8]。
上面提及的技术是基于将压缩形式的人类空间听觉的相关感知提示以及相关联的单声道或立体声下混频信号传输至接收器。典型的提示可以是声道间级差(ILD)、声道间相关或相干(ICC)、以及声道间时间差(ITD)、声道间相位差(IPD)、及总相位差(OPD)。
这些参数在一些情况中以适合于人类听觉分辨率的频率与时间分辨率来传输。
对该传输而言,典型地对这些参数进行量化(或在一些情况中甚至必须被量化),其中经常(尤其是对低比特率情境)使用相当粗略的量化。
时间上的更新间隔由编码器根据信号特性确定。这意味着,并非对下混频信号的每个采样都传输参数。换言之,在一些情况中,描述上面提及的提示的参数的传输速率(或传输频率,或更新速率)可以小于音频采样(或诸组音频采样)的传输速率(或传输频率,或更新速率)。
代替传输声道间相位差(IPD)及总相位差(OPD),仅传输声道间相位差(IPD)并估计解码器中总相位差(OPD)也是可能的。
由于解码器在一些情况中可能必须以无隙方式随时间将参数连续应用于例如每个采样(或音频采样),因此可能需要在解码器侧处得到中间参数,典型地是通过过去与当前参数集的间的内插。
然而,一些传统内插方法导致不良的音频质量。
下面参考图7将描述通用双耳提示编码方案。图7示出了双耳提示编码传输系统800的示意框图,该双耳提示编码传输系统800包含双耳提示编码编码器810及双耳提示编码解码器820。双耳提示编码编码器810可以例如接收多个音频信号812a、812b及812c。进一步地,双耳提示编码编码器810被配置为利用下混频器814来对音频输入信号812a-812c进行下混频以获得下混频信号816,该下混频信号816例如可以是和信号且可被用“AS”或“X”表示。进一步地,双耳提示编码编码器810被配置为利用分析器818来分析音频输入信号812a-812c以获得辅助信息信号819(“SI”)。和信号816及辅助信息信号819自双耳提示编码编码器810传输至双耳提示编码解码器820。双耳提示编码解码器820可被配置为基于和信号816及声道间提示824合成多声道音频输出信号,该多声道音频输入信号例如包含音频声道y1、y2,...yN。为此目的,双耳提示编码解码器820可以包含双耳提示编码合成器822,该双耳提示编码合成器822接收和信号816及声道间提示824并提供音频信号y1、y2,...yN。
双耳提示编码解码器820进一步包含辅助信息处理器826,该辅助信息处理器826被配置为接收辅助信息819,以及可选地接收使用者输入827。该辅助信息处理器826被配置为基于辅助信息819和可选使用者输入827来提供声道间提示824。
总之,对音频输入信号进行分析且下混频。和信号与辅助信息被传输至解码器。声道间提示是由辅助信息及本地使用者输入来产生的。双耳提示编码合成产生多声道音频输出信号。
至于详情请参考C.Faller与F.Baumgarte所著文章“Binaural Cue Coding Part II:Schemes and applications,″(出版于:2003年11月第11卷语音与音频处理的IEEE学报)。
然而,已得知的是,如果辅助信息被粗略量化或分辨率不足,许多传统双耳提示编码解码器提供质量劣化的多声道输出音频信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310120468.X/2.html,转载请声明来源钻瓜专利网。