[发明专利]用于音频变换编码中重叠率的信号自适应切换的编码器、解码器以及方法有效
申请号: | 201680067262.7 | 申请日: | 2016-09-23 |
公开(公告)号: | CN108463850B | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 克里斯蒂安·赫尔姆里希;贝恩德·埃德勒;托拜厄斯·施维格勒;弗洛里安·舒赫 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/022 | 分类号: | G10L19/022;G10L19/02;G10L19/22 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋融冰 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 音频 变换 编码 重叠 信号 自适应 切换 编码器 解码器 以及 方法 | ||
提供了用于解码多个频谱域音频样本的解码器。该解码器包括用于从频谱域音频样本生成第一组时域中间音频样本和第二组时域中间音频样本的第一解码模块(110)。而且,该解码器包括重叠加法器(130),用于以多于5%且至多50%的重叠将第一组时域中间音频样本和第二组时域中间音频样本重叠相加。此外,该解码器包括用于从频谱域音频样本生成第三组时域中间音频样本和第四组时域中间音频样本的第二解码模块(120)。而且,该解码器包括输出接口(140)。重叠加法器(130)被配置为以多于60%且少于100%的重叠将至少第三组时域中间音频样本和第四组时域中间音频样本重叠相加。而且,重叠加法器(130)被配置为将至少第二组时域中间音频样本和第三组时域中间音频样本重叠相加,或者将至少第四组时域中间音频样本和第一组时域中间音频样本重叠相加。
技术领域
本发明涉及音频信号编码、处理和解码,并且特别地涉及用于音频变换编码中重叠率的信号自适应切换的编码器、解码器和方法。
背景技术
在过去的20年中,特别是自从MPEG-1层3(MP3)和AC-2(杜比数字)编码器的发展以来,感知音频编码完全依赖于由Princen等人引入(参见[1],[2])的并针对波形保持谱量化由Malvar以调制重叠变换(MLT)的名义进一步研究(参见[3])的改进的离散余弦变换(MDCT)。给定帧索引i的长度为M的谱Xi′,这个变换的逆可以写为
其中0≤nN并且N是窗口长度。由于因此重叠率为50%。在基于MPEG-2高级音频编码(AAC)规范的最近标准(参见[4],[5])中,这个概念已经扩展到也允许参数化工具(诸如MDCT域中的噪声填充)。例如,MPEG-H 3D音频框架(参见[6],[7])为以下提出:半参数变换域编码,例如,一些频率上的归零谱线的噪声填充功能;用于半参数联合立体声编码的立体声填充(参见[8],[9]);以及用于扩展带宽的智能间隙填充(IGF)(参见[10])。
在[9]中,IGF和立体声填充的结合([8]中标题为谱带替换(SBS)),辅以针对具有非平凡声道间相位差的输入的变换内核切换,被示出为大部分信号提供良好的音频质量。但是,对于准静止谐波段,主观性能低于在伪QMF域中使用谱带复制(SBR)和“统一立体声”MPEG环绕的替代高延迟/复杂3D音频配置。对这种行为的解释是在后一种配置中使用的MDCT的较高频率分辨率:在48kHz的给定输出采样率下,M大小的核心变换在24kHz的下采样降混和残余信号上操作,从而使帧长度加倍。
基于SBS的3D音频编码由于其延迟、复杂性和时间分辨率优势[8]而至少针对单声道和立体声信号表现选择的变体,并且期望改进其设计-同时维持帧长度-使得其性能可以与基于QMF的配置相匹配,即使在单乐器和其它音调录制上。准静止段上提高频谱效率的可行解决方案是由Malvar提出的扩展重叠变换(ELT)(参见[11],[12]),除0≤nL且L≥4M以外,其逆(合成)版本与(1)完全相同。
因此,公式(1)指示逆MLT以及逆ELT。唯一的区别是,在逆MLT的情况下,n被定义为0≤nN,例如N=2·M,在逆ELT的情况下,n被定义为0≤nL,例如,L≥4M。
遗憾的是,如下所示,ELT的重叠率至少为75%,而不是MDCT的50%,这常常导致瞬态波形部分(如鼓击或音调开始)的可听的伪影。而且,与MDCT编解码器中用于精确地这种瞬态帧的技术类似,用于不同长度的ELT之间或者ELT与MLT之间的块长度切换的实际解决方案尚未给出并且仅公开了理论工作(参见例如[13],[14],[15],[16],[17])。
发明内容
本发明的目标是为音频信号编码、处理和解码提供改进的概念。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680067262.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种计算机实现的方法和计算系统
- 下一篇:多位非易失性随机存取存储器单元