[发明专利]用于控制对经低比特率编码的音频的增强的方法和装置在审
申请号: | 201980055735.5 | 申请日: | 2019-08-29 |
公开(公告)号: | CN112639968A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | A·比斯瓦斯;戴佳;A·S·马斯特 | 申请(专利权)人: | 杜比国际公司;杜比实验室特许公司 |
主分类号: | G10L19/24 | 分类号: | G10L19/24;G10L21/02;G10L25/30 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 魏小薇;吴丽丽 |
地址: | 荷兰阿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 控制 比特率 编码 音频 增强 方法 装置 | ||
描述了一种用于对音频数据进行低比特率编码并生成用于在解码器侧控制对所述经低比特率编码的音频数据的音频增强的增强元数据的方法,所述方法包括以下步骤:(a)以低比特率对原始音频数据进行核心编码以获得经编码的音频数据;(b)生成要用于在对所述经编码的音频数据进行核心解码之后在所述解码器侧控制音频增强的类型和/或量的增强元数据;以及(c)输出所述经编码的音频数据和所述增强元数据。进一步描述了被配置为执行所述方法的编码器。此外,描述了一种用于基于增强元数据从经低比特率编码的音频数据生成增强的音频数据的方法以及一种被配置为执行所述方法的解码器。
相关申请的交叉引用
本申请要求2018年8月30日提交的PCT申请号PCT/CN2018/103317、2018年9月19日提交的美国临时专利申请号62/733,409和2019年5月20日提交的美国临时专利申请号62/850,117的优先权,其中每个申请均通过引用以其全文并入本文。
技术领域
本公开总体上涉及一种用于对音频数据进行低比特率编码并生成用于在解码器侧控制对经低比特率编码的音频数据的音频增强的增强元数据的方法,并且更具体地涉及生成要用于在对经编码的音频数据进行核心解码(core decoding)之后在解码器侧控制音频增强的类型和/或量的增强元数据。此外,本公开涉及相应的编码器、一种用于基于增强元数据从经低比特率编码的音频数据生成增强的音频数据的方法以及相应的解码器。
尽管本文将特别地参考该公开内容来描述一些实施例,但是应当理解,本公开不限于这种使用领域,并且可应用于更广泛的背景下。
背景技术
在整个公开内容中对背景技术的任何讨论绝不应视为承认该技术是本领域众所周知的或形成本领域公知常识的一部分。
近年来,已经观察到尤其是深度学习方法可以提供突破性的音频增强。
音频记录系统用于将音频信号编码为适合于传输或存储的经编码信号,并且随后接收或取得所述经编码信号并进行解码以获得原始(original)音频信号版本以供回放。低比特率音频编码是一种允许降低带宽和存储要求的感知音频压缩技术。感知音频编码系统的示例包括Dolby-AC3、高级音频编码(AAC)以及最近由ETSI标准化并且包括在ATSC 3.0中的标准化的Dolby AC-4音频编码系统。
然而,低比特率音频编码引入了不可避免的编码伪像。以低比特率编码的音频可能尤其经受音频信号中的细节的困扰,并且由于量化和编码引入的噪声可能降低音频信号的质量。在这方面的特定问题是所谓的预回声伪像。预回声伪像是在频域中对瞬态音频信号进行量化时产生的,这导致量化噪声先于瞬态音频信号扩散。预回声噪声确实严重损害了音频编解码器(如例如MPEG AAC编解码器或任何其他基于变换(例如,基于MDCT)的音频编解码器)的质量。
迄今为止,已经开发了几种方法用于减少预回声噪声并因此提高经低比特率编码的音频的质量。这些方法包括短块切换和时域噪声整形(TNS)。后一种技术基于在频域中应用预测滤波器,以对时域中的量化噪声进行整形,从而使得噪声看起来对用户的干扰较小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比国际公司;杜比实验室特许公司,未经杜比国际公司;杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980055735.5/2.html,转载请声明来源钻瓜专利网。