[发明专利]用于解码音频信号的解码器及方法,用于编码音频信号的编码器及方法有效
申请号: | 201580036479.7 | 申请日: | 2015-06-25 |
公开(公告)号: | CN106663439B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 萨沙·迪施;米可-维利·莱迪南;维利·普尔基 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L21/007;G10L19/22;G10L21/02;G10L19/02;G10L19/18;G10L21/038;G10L19/025;G10L19/26 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋融冰 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 解码 音频 信号 解码器 方法 编码 编码器 | ||
示出用于解码音频信号32的解码器110”。解码器110”包括第一目标频谱生成器65a,其用于使用第一校正数据295a生成用于音频信号32的子带信号的第一时间帧的目标频谱85a”;第一相位校正器70a,用于校正以频谱校正算法确定的音频信号32的第一时间帧中的子带信号的相位45,其中通过降低音频信号32的第一时间帧中的子带信号的测量与目标频谱85a”之间的差异执行校正;以及音频子带信号计算器350,用于使用用于时间帧的校正的相位91a计算用于第一时间帧的音频子带信号355,并用于使用第二时间帧中的子带信号85a”的测量或使用依照与相位校正算法不同的另一相位校正算法的校正的相位计算,计算用于与第一时间帧不同的第二时间帧的音频子带信号355。
技术领域
本发明涉及用于处理音频信号的音频处理器及方法、用于对音频信号进行解码的解码器及方法以及用于对音频信号进行编码的编码器及方法。此外,描述用于确定相位校正数据、音频信号的计算器及方法以及用于执行先前提及的方法中的一个的计算机程序。换言之,本发明示出相位导数校正及带宽扩展(BWE)用于感知的音频编解码器或用于基于感知重要性校正QMF域中的带宽扩展信号的相位谱。
背景技术
感知音频编码
至今所见的感知音频编码遵循多个常见主题,包括时域/频域处理、冗余度缩减(熵编码)及通过感知效果的发音开发的不相关性移除的使用[1]。通常,输入信号由分析滤波器组分析,该分析滤波器组将时域信号转换为谱(时间/频率)表示。转换为谱系数允许根据信号分量的频率内容(例如具有其独特泛音结构的不同乐器)选择性地处理信号分量。
平行地,关于输入信号的感知特性分析输入信号,即(特别地)计算时间相依及频率相依的掩蔽阈值。通过用于每个频带并对时间帧进行编码的绝对能量值或掩蔽信号比(MSR)形式的目标编码阈值将时间相依/频率相依掩蔽阈值传输至量化单元。
对由分析滤波器组传输的谱系数进行量化以降低表示信号所需要的数据速率。此步骤意味着信息损失并将编码失真(误差、噪声)引入信号中。为了最小化此编码噪声的可听影响,根据用于每个频带及帧的目标编码阈值控制量化器步长。理想地,注入至每个频带中的编码噪声低于编码(掩蔽)阈值,且因此主观音频中的降级为不可感知的(不相干性的移除)。根据心理声学要求对频率及时间上的量化噪声的此控制导致复杂噪声成形效应,且使编码器成为感知音频编码器。
随后,现代音频编码器对量化的谱数据执行熵编码(例如,霍夫曼编码、算术编码)。熵编码为无损编码步骤,其可进一步节省比特率。
最后,所有的编码的谱数据及相关额外参数(旁侧信息,如例如用于每个频带的量化器设置)一起打包至比特流中,其为用于文件存储或传输的最终编码表示。
带宽扩展
在基于滤波器组的感知音频编码中,所消耗的比特率的主要部分通常消耗在量化的谱系数上。因此,以极低的比特率,不足的比特可用于以达到感知上未受损的再现所需的精度表示所有系数。因此,低比特率要求有效地设定对可通过感知音频编码获取的音频带宽的限制。带宽扩展[2]消除此长期存在的基本限制。带宽扩展的中心思想在于通过额外高频率处理器补充有限带宽感知编解码器,该额外高频率处理器以紧凑参数形式传输并恢复缺失的高频内容。可基于基带信号的单个边频带调制、基于如在谱带复制(SBR)[3]中使用的备份技术或基于音高移位(pitch shifting)技术的应用(例如声码器[4])生成高频内容。
数字音效
通常可通过应用时域技术(如同步叠加(SOLA))或频域技术(声码器)获取时间拉伸或音高移位效果。另外,已提出了在子带中应用SOLA处理的混合系统。声码器及混合系统通常因可归因于垂直相位相干性的损失的被称为相位错乱(phasiness)[8]的人为现象(artifact)而受损。一些出版物涉及通过在垂直相位相干性重要的情况下保留垂直相位相干性而对时间拉伸算法的音质的改良[6][7]。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580036479.7/2.html,转载请声明来源钻瓜专利网。