[发明专利]用于处理多声道音频信号的方法及设备有效
申请号: | 201180034344.9 | 申请日: | 2011-07-15 |
公开(公告)号: | CN103155030A | 公开(公告)日: | 2013-06-12 |
发明(设计)人: | 阿里斯·塔勒布;大卫·维雷特;庞立昀;郎玥 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L21/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 多声道 音频 信号 方法 设备 | ||
技术领域
本发明涉及用于处理多声道音频信号的方法及设备。
背景技术
时间比例缩放调整算法可改变音频信号的持续时间,同时保留了信号局部频率组成,从而可实现使记录的音频信号的感受到的播放速率加速或减速的整体效果,却不会影响到原始信号的音调或音色。换言之,虽然原始信号的持续时间增加或减少,但感觉上原始信号的重要特征保持不变;在语音的情况下,经过时间比例缩放调整的信号听起来就好像原始说话者是以较快或较慢的速率说话一样;在音乐的情况下,经过时间比例缩放调整的信号听起来就好像演奏者用不同的节奏演奏一样。时间比例缩放调整算法可用于VoIP应用或音频/视频广播、音频/视频后期制作同步及多轨记录与混频中的自适应抖动缓冲管理(JBM)。
在IP语音应用中,首先使用语音编码器压缩语音信号。为了保持互通性,IP语音系统通常建立在开放语音编解码器上。这些系统可经标准化,例如在ITU-T或3GPP编解码器中(若干标准化语音编解码器用于VoIP:G.711、G.722、G.729、G.723.1、AMR-WB)或具有专有格式(Speex、Silk、CELT)。经编码的语音信号在IP包中分包及传输。
包将在VoIP中遇到可变网络延迟,因此包以不规则的时间间隔到达。为了使此抖动平滑,在接收器中通常需要抖动缓冲管理机制,其中将接收到的包缓冲一会儿,并在调度的时间循序播出。如果可针对每个包调整播出时间,则可能需要进行时标修改以确保在声卡上连续播出语音数据。
因为延迟并不是恒定的延迟,所以使用时间比例缩放调整算法来拉伸或压缩给定的接收到的包的持续时间。在包含抖动缓冲管理机制的多声道VoIP应用的情况下,特别是当多声道音频编解码器是基于以双重/多重单声道模式操作的单声道编解码器的时候,即,针对每个声道使用一个单声道编码器/解码器,则针对每个声道使用时间比例缩放调整算法的独立应用,可能导致质量下降,特别是空间声音图像的质量下降,因为独立的时间比例缩放调整将无法保证保留空间线索。在音频/视频广播及后期制作应用中,对每个声道进行时间比例缩放调整可能会保持视频与音频之间的同步,但无法保证空间线索与原始的空间线索一样。空间感知的最重要的空间线索是声道之间的能量差,声道之间的时间或相位差,及声道之间的相干或相关。当时间比例缩放调整算法进行音频信号的拉伸及压缩操作时,时间比例缩放调整声道之间的能量、延迟及相干可能与原始的不同。
发明内容
本发明的目标是提供一种在多声道音频应用中的抖动缓冲管理的概念,其可保留空间感知。
这个目标是通过独立权利要求的特征实现的。通过附属权利要求、说明及附图可了解其它实施形式。
本发明的基本原理是,在多声道时间比例缩放调整处理期间保留多声道音频信号的空间线索,可保留空间感知。空间线索是多声道信号的空间信息,例如声道间时间差(ITD)、声道间声级差(ILD)、声道间相干/声道间交叉相关(ICC)等等。
为了详细说明本发明,将使用以下术语、缩写及符号。
ITD:声道间时间差,
ILD:声道间声级差,
ICC:声道间相干,
IC:声道间交叉相关,
交叉AMDF:交叉平均幅度差函数,
WSOLA:基于波形相似性的同步重叠相加,
IP:因特网协议,
VoIP:因特网协议语音。
根据第一方面,本发明涉及一种处理多声道音频信号的方法,所述多声道音频信号带有多个音频声道信号,所述方法包括:使用所述多个音频声道信号来确定时间比例缩放调整位置;及根据所述时间比例缩放调整位置对所述多个音频声道信号的每个音频声道信号进行时间比例缩放调整,以获得多个经时间比例缩放调整的音频声道信号。
时间比例缩放调整位置能使不同的音频声道信号同步,以便保留空间信息。在包含抖动缓冲管理机制的多声道VoIP应用的情况下,当多声道音频编解码器是基于以双重/多重单声道模式操作的单声道编解码器的时候,即,针对每个声道使用一个单声道编码器/解码器,则针对每个声道使用时间比例缩放调整算法的独立应用,不会导致质量下降,因为时间比例缩放调整位置使每个声道的时间比例缩放调整同步,从而保留空间线索,因而保留空间声音图像。用户能在很大程度上更好地感知到多声道音频信号。
在音频/视频广播及后期制作应用中,用共同的时间比例缩放调整位置单独对每个声道进行时间比例缩放调整,可保留视频与音频之间的同步,而且能保证空间线索不会改变。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180034344.9/2.html,转载请声明来源钻瓜专利网。