[发明专利]用于控制对经低比特率编码的音频的增强的方法和装置在审
申请号: | 201980055735.5 | 申请日: | 2019-08-29 |
公开(公告)号: | CN112639968A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | A·比斯瓦斯;戴佳;A·S·马斯特 | 申请(专利权)人: | 杜比国际公司;杜比实验室特许公司 |
主分类号: | G10L19/24 | 分类号: | G10L19/24;G10L21/02;G10L25/30 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 魏小薇;吴丽丽 |
地址: | 荷兰阿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 控制 比特率 编码 音频 增强 方法 装置 | ||
1.一种用于对音频数据进行低比特率编码并生成用于在解码器侧控制对经低比特率编码的音频数据的音频增强的增强元数据的方法,所述方法包括以下步骤:
(a)以低比特率对原始音频数据进行核心编码以获得经编码的音频数据;
(b)生成要用于在对所述经编码的音频数据进行核心解码之后在所述解码器侧控制音频增强的类型和/或量的增强元数据;以及
(c)输出所述经编码的音频数据和所述增强元数据。
2.如权利要求1所述的方法,其中,在步骤(b)中的生成增强元数据包括:
(i)对所述经编码的音频数据进行核心解码以获得经核心解码的初始音频数据;
(ii)将所述经核心解码的初始音频数据输入到音频增强器以基于候选增强元数据处理所述经核心解码的初始音频数据,所述候选增强元数据用于控制对输入到所述音频增强器的音频数据的音频增强的类型和/或量;
(iii)获得增强的音频数据作为来自所述音频增强器的输出;
(iv)基于所述增强的音频数据确定所述候选增强元数据的适用性;以及
(v)基于所述确定的结果生成增强元数据。
3.如权利要求2所述的方法,其中,在步骤(iv)中的确定所述候选增强元数据的适用性包括:向用户呈现所述增强的音频数据并且响应于所述呈现而接收来自所述用户的第一输入,并且其中,在步骤(v)中生成所述增强元数据是基于所述第一输入的。
4.如权利要求3所述的方法,其中,来自所述用户的所述第一输入包括所述候选增强元数据是被所述用户接受还是拒绝的指示。
5.如权利要求4所述的方法,其中,在所述用户拒绝所述候选增强元数据的情况下,从所述用户接收指示对所述候选增强元数据进行修改的第二输入,并且在步骤(v)中的生成所述增强元数据是基于所述第二输入的。
6.如权利要求4或5所述的方法,其中,在所述用户拒绝所述候选增强元数据的情况下,重复步骤(ii)至(v)。
7.如权利要求1至6中任一项所述的方法,其中,所述增强元数据包括增强控制数据的一个或多个项目。
8.如权利要求7所述的方法,其中,所述增强控制数据包括关于音频增强的一个或多个类型的信息,所述音频增强的一个或多个类型包括语音增强、音乐增强和掌声增强中的一个或多个。
9.如权利要求8所述的方法,其中,所述增强控制数据进一步包括关于所述音频增强的一个或多个类型的相应容许性的信息。
10.如权利要求7至9中任一项所述的方法,其中,所述增强控制数据进一步包括关于音频增强的量的信息。
11.如权利要求7至10中任一项所述的方法,其中,所述增强控制数据进一步包括关于是否要由在所述解码器侧的自动更新的音频增强器执行音频增强的容许性的信息。
12.如权利要求7至11中任一项所述的方法,其中,通过应用一个或多个预定义的音频增强模块来执行在步骤(ii)中的基于所述候选增强元数据处理所述经核心解码的初始音频数据,并且其中,所述增强控制数据进一步包括关于使用在解码器侧的实现相同或基本上相同类型的增强的一个或多个不同的增强模块的容许性的信息。
13.如权利要求2至12中任一项所述的方法,其中,所述音频增强器是生成器。
14.一种用于生成用于控制对经低比特率编码的音频数据的增强的增强元数据的编码器,其中,所述编码器包括一个或多个处理器,所述一个或多个处理器被配置为执行根据权利要求1至13中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比国际公司;杜比实验室特许公司,未经杜比国际公司;杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980055735.5/1.html,转载请声明来源钻瓜专利网。