[发明专利]用于在过渡频率附近使用交叉滤波器对编码音频信号进行解码的设备及方法有效
申请号: | 201480041218.X | 申请日: | 2014-07-15 |
公开(公告)号: | CN105556603B | 公开(公告)日: | 2019-08-27 |
发明(设计)人: | 萨沙·迪施;拉尔夫·盖格尔;克里斯蒂安·黑尔姆里希;弗雷德里克·纳格尔;克里斯蒂安·诺伊坎;康斯坦丁·施密特;米夏埃尔·菲舍尔 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L21/0388 | 分类号: | G10L21/0388;G10L19/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;杨华 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 过渡 频率 附近 使用 交叉 滤波器 编码 音频 信号 进行 解码 设备 方法 | ||
一种用于对包括编码核心信号(1)的编码音频信号进行解码的设备,包括:核心解码器(1400),用于对编码核心信号(1401)进行解码以获得解码核心信号;铺片生成器(1404),用于使用解码核心信号的频谱部分来生成一个或更多个频谱铺片,所述一个或更多个频谱铺片具有未包括在解码核心信号中的频率;以及交叉滤波器(1406),用于对解码核心信号和具有从间隙填充频率(309)延伸至上边界频率的频率的第一频率铺片进行频谱交叉滤波,或者用于对第一频率铺片和第二频率铺片进行频谱交叉滤波。
技术领域
本发明涉及音频编码/解码,并且特别地涉及使用智能间隙填充(IGF)的音频编码。
背景技术
音频编码为使用心理声学知识处理音频信号中的冗余及无关部分的信号压缩领域。如今音频编解码器通常需要大约60kbps/声道以对几乎任何类型的音频信号进行感知透明编码。较新的编解码器旨在使用如带宽扩展(BWE)的技术通过利用信号中的频谱相似度来降低编码比特率。BWE方案使用低比特率参数集来表示音频信号的高频(HF)分量。HF频谱填充有来自低频(LF)区域的频谱内容,并且频谱形状、倾斜和时域连续性被调整以维持原始信号的音质和音色。这样的BWE方法使得音频编解码器即使在大约24kbps/声道的低比特率下仍能够保持良好的品质。
音频编码系统有效地以宽范围的比特率对任意音频信号进行编码。然而,对于高比特率,本发明的系统会聚于透明度,对于低比特率,使感知烦恼最小化。因此,可用比特率的主要份额用于在编码器中对信号的仅感知上最相关的结构进行波形编码,并且结果的频谱间隙在解码器中以大致近似原始频谱的信号内容来填充。非常有限的比特预算被消耗以通过从编码器发送至解码器的专用边信息来控制参数驱动的所谓的频谱智能间隙填充(IGF)。
音频信号的存储或传输经常受到严格的比特率约束。在过去,仅当有很低的比特率可用时编码器才被迫大幅度地减小传输音频带宽。
现代音频编解码器如今能够通过使用带宽扩展(BWE)方法[1]对宽带信号进行编码。这些算法依赖于高频内容(HF)的参数化表示以及参数驱动的后处理的应用,高频内容(HF)的参数化表示借助于将解码信号的波形编码的低频部分(LF)转移至HF频谱区域中(“修补(patching)”)来生成。按照BWE方案,高于给定的所谓的交叉频率的HF频谱区域的重构通常基于频谱修补。通常,HF区域包括多个相邻补片,并且这些补片中的每一者源自低于给定的交叉频率的LF频谱的带通(BP)区域。现有技术系统通过将一组相邻子带系数从源区域拷贝至目标区域来有效地执行滤波器组表示例如正交镜像滤波器组(QMF)内的修补。
在如今的音频编解码器中发现的提高压缩效率从而使得能够在低比特率下扩展音频带宽的另一种技术是音频频谱的适当部分的参数驱动合成替换。例如,原始音频信号的类噪声信号部分可以用在解码器中生成并且由边信息参数缩放的人造噪声来替换,而基本上不损失主观品质。一个示例是包括在MPEG-4高级音频编码(AAC)中的感知噪声替代(PNS)工具[5]。
还提供了也使得能够在低比特率下扩展带宽的另一种技术,其是包括在MPEG-D统一语音与音频编码(USAC)[7]中的噪声填充技术。通过由于太粗糙的量化而由量化器的死区得出的频谱间隙(零)随后以解码器中的人工噪声来填充并且通过参数驱动后处理来缩放。
另一种现有技术系统被称为精确频谱替换(ASR)[2-4]。除了波形编解码器以外,ASR还采用专用信号合成段,其在解码器处恢复信号的感知上重要的正弦部分。此外,[5]中描述的系统依赖于波形编码器的HF区域中的正弦建模以使得扩展的音频带宽在低比特率下仍具有还不错的感知品质。所有这些方法涉及将数据变换至除了改进的离散余弦变换(MDCT)以外的第二域的变换并且还涉及用于保留HF正弦分量的相当复杂的分析/合成段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480041218.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体存储装置
- 下一篇:多声道音频内容的编码和解码