[发明专利]音频编解码方法、装置、存储介质及计算机设备在审
申请号: | 202310453713.2 | 申请日: | 2023-04-18 |
公开(公告)号: | CN116504254A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 姜鹏;谯轶轩 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L19/005 | 分类号: | G10L19/005;G10L19/16;G10L19/00 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 魏来 |
地址: | 518000 广东省深圳市福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 解码 方法 装置 存储 介质 计算机 设备 | ||
1.一种音频编解码方法,其特征在于,所述方法包括:
获取原始音频数据,对所述原始音频数据进行向下采样,得到第一特征向量,并对所述第一特征向量进行卷积处理,得到编码向量;
基于预设码本,对所述编码向量进行多级量化,以将所述编码向量量化为在所述预设码本内与所述编码向量最相似的码本向量;
对所述码本向量进行向上采样,得到第二特征向量,并对所述第二特征向量进行卷积处理,得到音频解码数据。
2.根据权利要求1所述的方法,其特征在于,所述获取原始音频数据,对所述原始音频数据进行向下采样,得到第一特征向量,并对所述第一特征向量进行卷积处理,得到编码向量,包括:
获取原始音频数据,对所述原始音频数据进行分帧处理,得到所述原始音频数据的音频帧;
基于卷积网络构建编码器,其中,所述编码器包括编码器输入层、多个下采样层和编码器输出层;
将所述原始音频数据的音频帧发送至所述编码器输入层,并通过所述多个下采样层对所述原始音频数据的音频帧进行向下采样,得到所述第一特征向量;
将所述第一特征向量发送至所述编码器输出层,对所述第一特征向量进行卷积处理,得到所述原始音频数据的编码向量。
3.根据权利要求2所述的方法,其特征在于,所述原始音频数据的音频帧包括当前音频帧和历史音频帧;所述通过所述多个下采样层对所述原始音频数据的音频帧进行向下采样,得到所述第一特征向量,包括:
基于所述多个下采样层对所述历史音频帧进行向下采样,得到多个所述历史音频帧的特征向量,其中,所述历史音频帧的特征向量的数量与所述下采样层的数量相等;
基于所述多个下采样层对所述当前音频帧进行向下采样,并对所述历史音频帧的特征向量同步进行向下采样,得到所述第一特征向量。
4.根据权利要求1所述的方法,其特征在于,所述基于预设码本,对所述编码向量进行多级量化,以将所述编码向量量化为在所述预设码本内与所述编码向量最相似的码本向量,包括:
获取量化器,并确定每一所述量化器对应的预设码本,其中,所述量化器的数量为N,N为大于1的正整数,所述预设码本包括第一码本、第二码本...第N码本;
获取所述编码向量,在所述第一码本中检索与所述编码向量最相似的第一码本向量,对所述编码向量与所述第一码本向量作差,得到第一残差向量;
在所述第二码本中检索与所述第一残差向量最相似的第二码本向量,对所述第一残差向量与所述第二码本向量作差,得到第二残差向量;
以此类推,直至在所述第N码本中检索到与所述第N-1残差向量最相似的第N码本向量;
对所述第一码本向量至所述第N码本向量进行求和,得到所述编码向量对应的所述码本向量。
5.根据权利要求4所述的方法,其特征在于,所述获取量化器,并确定每一所述量化器对应的预设码本,包括:
获取所述量化器对应的预设码本,并对所述预设码本中的码本向量逐一进行判断;
当存在所述码本向量与任一所述编码向量均不相似时,将所述码本向量移除所述预设码本;
获取所述编码向量,并基于k均值聚类算法对所述编码向量进行聚类,得到聚类质心点的向量,将所述聚类质心点的向量添加至所述预设码本中。
6.根据权利要求1所述的方法,其特征在于,所述对所述码本向量进行向上采样,得到第二特征向量,并对所述第二特征向量进行卷积处理,得到音频解码数据,包括:
基于卷积网络构建解码器,其中,所述解码器包括解码器输入层、多个上采样层和解码器输出层;
将所述码本向量发送至所述解码器输入层,并通过所述多个上采样层对所述码本向量进行向上采样,得到所述第二特征向量;
将所述第二特征向量发送至所述解码器输出层,对所述第二特征向量进行卷积处理,得到所述音频解码数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310453713.2/1.html,转载请声明来源钻瓜专利网。