[发明专利]用于利用生成模型的码率质量可分级编码的方法及设备在审
申请号: | 201980071838.0 | 申请日: | 2019-10-29 |
公开(公告)号: | CN112970063A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | J·克勒吉萨;P·赫德林 | 申请(专利权)人: | 杜比国际公司 |
主分类号: | G10L19/24 | 分类号: | G10L19/24;G10L25/30 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 刘锋 |
地址: | 荷兰阿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 利用 生成 模型 质量 分级 编码 方法 设备 | ||
1.一种对音频或语音信号进行解码的方法,所述方法包含以下步骤:
(a)由接收器接收包含所述音频或语音信号及调节信息的经编码位流;
(b)由位流解码器提供呈与第一位率相关联的格式的经解码调节信息;
(c)由转换器将所述经解码调节信息从与所述第一位率相关联的所述格式转换为与第二位率相关联的格式;及
(d)由生成神经网络根据由呈与所述第二位率相关联的所述格式的所述调节信息调节的概率模型来提供所述音频或语音信号的重构。
2.根据权利要求1所述的方法,其中所述第一位率是目标位率且所述第二位率是默认位率。
3.根据权利要求1或2所述的方法,其中所述调节信息包含嵌入式部分及非嵌入式部分。
4.根据权利要求1到3中任一权利要求所述的方法,其中所述调节信息包含一或多个调节参数。
5.根据权利要求4所述的方法,其中所述一或多个调节参数是声码器参数。
6.根据权利要求4或5所述的方法,其中将所述一或多个调节参数唯一地分配给所述嵌入式部分及所述非嵌入式部分。
7.根据权利要求6所述的方法,其中所述嵌入式部分的所述调节参数包含以下中的一或多者:来自线性预测滤波器的反射系数,或从低频到高频排序的子带能量的矢量,或卡洛南-洛伊变换的系数或频率变换的系数。
8.根据权利要求6或7所述的方法,其中与所述第一位率相关联的所述调节信息的所述嵌入式部分的被定义为所述调节参数的数目的维数低于或等于与所述第二位率相关联的所述调节信息的所述嵌入式部分的维数,且其中与所述第一位率相关联的所述调节信息的所述非嵌入式部分的维数相同于与所述第二位率相关联的所述调节信息的所述非嵌入式部分的维数。
9.根据权利要求6到8中任一权利要求所述的方法,其中步骤(c)进一步包含:
(i)凭借零填充将与所述第一位率相关联的所述调节信息的所述嵌入式部分的所述维数扩展为与所述第二位率相关联的所述调节信息的所述嵌入式部分的所述维数;或
(ii)凭借基于与所述第一位率相关联的所述调节信息的可用调节参数预测任何丢失的调节参数来将与所述第一位率相关联的所述调节信息的所述嵌入式部分的所述维数扩展为与所述第二位率相关联的所述调节信息的所述嵌入式部分的所述维数。
10.根据权利要求6到9中任一权利要求所述的方法,其中步骤(c)进一步包含由所述转换器通过复制所述调节参数的值来将所述调节信息的所述非嵌入式部分从与所述第一位率相关联的所述调节信息转换成与所述第二位率相关联的所述调节信息的相应调节参数。
11.根据权利要求10所述的方法,其中使用比与所述第二位率相关联的所述调节信息的所述非嵌入式部分的所述相应调节参数更粗糙的量化器来量化与所述第一位率相关联的所述调节信息的所述非嵌入式部分的所述调节参数。
12.根据权利要求1到11中任一权利要求所述的方法,其中基于呈与所述第二位率相关联的所述格式的调节信息来训练所述生成神经网络。
13.根据权利要求1到12中任一权利要求所述的方法,其中所述生成神经网络可通过从条件概率密度函数执行采样来重构所述信号,所述条件概率密度函数是使用呈与所述第二位率相关联的所述格式的所述调节信息来调节的。
14.根据权利要求12或13所述的方法,其中所述生成神经网络是SampleRNN神经网络。
15.根据权利要求14所述的方法,其中所述SampleRNN神经网络是四层SampleRNN神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比国际公司,未经杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980071838.0/1.html,转载请声明来源钻瓜专利网。