[发明专利]加窗信号MDCT域的能量及相位调整方法及其装置有效
申请号: | 200910062028.7 | 申请日: | 2009-05-12 |
公开(公告)号: | CN101552006A | 公开(公告)日: | 2009-10-07 |
发明(设计)人: | 胡瑞敏;陈水仙;陈琪;陈冰;刘雨田;陈文琴 | 申请(专利权)人: | 武汉大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/02 |
代理公司: | 武汉天力专利事务所 | 代理人: | 严 彦;冯卫平 |
地址: | 43007*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信号 mdct 能量 相位 调整 方法 及其 装置 | ||
技术领域
本发明属于空间音频技术领域,特别是涉及加窗信号在MDCT域的能量及相 位调整方法及其装置。
背景技术
音频信号属于短时平稳过程,实际信号处理中,通过对信号采样分帧,将 具有平稳统计特性的每帧信号作为处理对象。信号分帧相当于采用普通矩形窗 对信号进行截短处理,由于矩形窗有陡峭的到零的下降沿,造成分帧后帧间的 频谱泄漏,使得重建后的声音信号在帧间产生抖动。因此,有必要在变换前对 时域信号加窗,避免因分帧产生的块效应,保证帧间过渡的平滑。多声道音频 编码技术追求高音质和低码率,为了重现原始声音效果,在实际信号处理中通 常以加窗信号作为研究对象。本发明所称多声道包括双声道及更多声道的情况。
对信号进行加窗处理时,通常应用的窗函数主要有矩形窗、三角窗、汉宁 窗、海明窗和凯撒窗等类型。其中矩形窗主瓣较集中,旁瓣较高并有负旁瓣, 易使变换产生高频干扰和频谱泄漏。与矩形窗相比,汉宁窗可缓解频谱泄漏, 但频率分辨力下降。海明窗与汉宁窗均为余弦窗,仅加权系数不同。每种窗型 都有自己的特点,实际信号处理时一般根据输入信号的特性选择窗型。
空间音频编码技术作为多声道音频技术的典型代表,将加窗后的多声道信 号所包含的音频信息和空间信息相分离并分别编码。现有的传统空间音频编解 码系统如图1所示,编码端输入的多声道信号加窗后,一方面通过下混成为一个 声道进行传统单声道音频编码(MDCT时频分析,包括MDCT变换和量化编码),另 一方面经声源分离(HQMF/CFB/STDFT时频分析)后进行空间参数提取和空间参数 编码;解码端通过码流分析分离出下混声道和空间参数信息,相应地分别对下 混声道进行传统单声道音频解码、上混,对空间参数信息进行空间参数解码, 最终通过合成滤波得到输出多声道信号。
在空间音频编码系统中,空间参数反映多声道音频信号(包括双声道)的 空间信息,编码端空间参数的有效提取是解码端音质还原的关键。空间参数主 要包括用以定位声源水平方位的声道间强度差(Interaural Level Difference, 简称ILD)和声道间时间差(Interaural Time Difference,简称ITD),以及 用以确定声源声场宽度的声道间相关度(Interaural Correlation,简称IC)。 其中,ILD记录了声道间信号的能量比,ITD记录了声道间信号具有最大互相关 的时间偏移,IC记录了此时的归一化相关度。因此,ILD和ITD分别与时域加 窗信号的能量及延时特性相关,IC同时受信号能量及延时特性的影响。
实际信号处理中,通常在编码端对加窗信号进行时频域变换,完成信号的 声源分离。在MP3、AAC等通用音频编码系统中,传统的单声道音频编码采用修 正离散余弦变换(Modified Discrete Cosine Transform,简称MDCT)作为最 常见的时频分析工具,且MDCT具有时域抗混叠特性;而编码端在提取声场空间 信息时则采用模拟人耳听觉特性的时频分析工具,包括人工耳蜗滤波器 (Cochlear Filter Bank,简称CFB)、短时离散傅立叶变换(Short-Time DFT, 简称STDFT)以及混合正交镜像滤波器组(Hybrid Quadrature Mirror Filterbank,简称HQMF)。
现有技术表明,若传统的单声道编码与空间参数提取使用相同的时频分析 工具,可以有效降低编解码的复杂度和算法延时。针对空间参数提取的时频分 析工具CFB、STDFT和HQMF由于复杂度、临界采样特性以及与心理声学的匹配 性等原因不适合在传统的单声道编码器中使用。因此,为了降低复杂度和延时, 当采用基于MDCT的感知音频编码器作为传统单声道编码器时,研究如何提取加 窗信号MDCT域上的空间参数成为空间音频编码领域的研究热点。
然而,MDCT变换属于实变换,与同时包含信号相位信息和幅度信息的复变 换不同,在MDCT域上提取空间参数存在困难:首先MDCT谱的能量抖动使MDCT 谱的声道间强度差ILD与原加窗信号ILD不一致,导致ILD参数提取存在差异; 其次MDCT谱中不包含直接的相位信息,难以反映原时域加窗信号的延时特性, 导致直接提取声道间时间差参数ITD存在困难。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910062028.7/2.html,转载请声明来源钻瓜专利网。