[发明专利]加窗信号MDCT域的能量及相位调整方法及其装置有效

专利信息
申请号: 200910062028.7 申请日: 2009-05-12
公开(公告)号: CN101552006A 公开(公告)日: 2009-10-07
发明(设计)人: 胡瑞敏;陈水仙;陈琪;陈冰;刘雨田;陈文琴 申请(专利权)人: 武汉大学
主分类号: G10L19/00 分类号: G10L19/00;G10L19/02
代理公司: 武汉天力专利事务所 代理人: 严 彦;冯卫平
地址: 43007*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信号 mdct 能量 相位 调整 方法 及其 装置
【说明书】:

技术领域

发明属于空间音频技术领域,特别是涉及加窗信号在MDCT域的能量及相 位调整方法及其装置。

背景技术

音频信号属于短时平稳过程,实际信号处理中,通过对信号采样分帧,将 具有平稳统计特性的每帧信号作为处理对象。信号分帧相当于采用普通矩形窗 对信号进行截短处理,由于矩形窗有陡峭的到零的下降沿,造成分帧后帧间的 频谱泄漏,使得重建后的声音信号在帧间产生抖动。因此,有必要在变换前对 时域信号加窗,避免因分帧产生的块效应,保证帧间过渡的平滑。多声道音频 编码技术追求高音质和低码率,为了重现原始声音效果,在实际信号处理中通 常以加窗信号作为研究对象。本发明所称多声道包括双声道及更多声道的情况。

对信号进行加窗处理时,通常应用的窗函数主要有矩形窗、三角窗、汉宁 窗、海明窗和凯撒窗等类型。其中矩形窗主瓣较集中,旁瓣较高并有负旁瓣, 易使变换产生高频干扰和频谱泄漏。与矩形窗相比,汉宁窗可缓解频谱泄漏, 但频率分辨力下降。海明窗与汉宁窗均为余弦窗,仅加权系数不同。每种窗型 都有自己的特点,实际信号处理时一般根据输入信号的特性选择窗型。

空间音频编码技术作为多声道音频技术的典型代表,将加窗后的多声道信 号所包含的音频信息和空间信息相分离并分别编码。现有的传统空间音频编解 码系统如图1所示,编码端输入的多声道信号加窗后,一方面通过下混成为一个 声道进行传统单声道音频编码(MDCT时频分析,包括MDCT变换和量化编码),另 一方面经声源分离(HQMF/CFB/STDFT时频分析)后进行空间参数提取和空间参数 编码;解码端通过码流分析分离出下混声道和空间参数信息,相应地分别对下 混声道进行传统单声道音频解码、上混,对空间参数信息进行空间参数解码, 最终通过合成滤波得到输出多声道信号。

在空间音频编码系统中,空间参数反映多声道音频信号(包括双声道)的 空间信息,编码端空间参数的有效提取是解码端音质还原的关键。空间参数主 要包括用以定位声源水平方位的声道间强度差(Interaural Level Difference, 简称ILD)和声道间时间差(Interaural Time Difference,简称ITD),以及 用以确定声源声场宽度的声道间相关度(Interaural Correlation,简称IC)。 其中,ILD记录了声道间信号的能量比,ITD记录了声道间信号具有最大互相关 的时间偏移,IC记录了此时的归一化相关度。因此,ILD和ITD分别与时域加 窗信号的能量及延时特性相关,IC同时受信号能量及延时特性的影响。

实际信号处理中,通常在编码端对加窗信号进行时频域变换,完成信号的 声源分离。在MP3、AAC等通用音频编码系统中,传统的单声道音频编码采用修 正离散余弦变换(Modified Discrete Cosine Transform,简称MDCT)作为最 常见的时频分析工具,且MDCT具有时域抗混叠特性;而编码端在提取声场空间 信息时则采用模拟人耳听觉特性的时频分析工具,包括人工耳蜗滤波器 (Cochlear Filter Bank,简称CFB)、短时离散傅立叶变换(Short-Time DFT, 简称STDFT)以及混合正交镜像滤波器组(Hybrid Quadrature Mirror Filterbank,简称HQMF)。

现有技术表明,若传统的单声道编码与空间参数提取使用相同的时频分析 工具,可以有效降低编解码的复杂度和算法延时。针对空间参数提取的时频分 析工具CFB、STDFT和HQMF由于复杂度、临界采样特性以及与心理声学的匹配 性等原因不适合在传统的单声道编码器中使用。因此,为了降低复杂度和延时, 当采用基于MDCT的感知音频编码器作为传统单声道编码器时,研究如何提取加 窗信号MDCT域上的空间参数成为空间音频编码领域的研究热点。

然而,MDCT变换属于实变换,与同时包含信号相位信息和幅度信息的复变 换不同,在MDCT域上提取空间参数存在困难:首先MDCT谱的能量抖动使MDCT 谱的声道间强度差ILD与原加窗信号ILD不一致,导致ILD参数提取存在差异; 其次MDCT谱中不包含直接的相位信息,难以反映原时域加窗信号的延时特性, 导致直接提取声道间时间差参数ITD存在困难。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910062028.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top