[发明专利]音频编解码方法和装置在审
申请号: | 202011004241.5 | 申请日: | 2020-09-22 |
公开(公告)号: | CN114299967A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 王萌;王卓;杜春晖;范泛 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/02 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 王洪 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 解码 方法 装置 | ||
1.一种音频编码方法,其特征在于,包括:
确定待编码的当前音频帧的信号类型和使用场景,所述使用场景包括低延时场景或者高音质场景;
根据所述当前音频帧的信号类型和所述当前音频帧的使用场景确定所述当前音频帧的初始编码方式,所述初始编码方式包括时域编码方式或者频域编码方式;
根据所述当前音频帧的初始编码方式与上一帧音频帧的最终编码方式确定所述当前音频帧的最终编码方式,所述最终编码方式包括时域编码方式、频域编码方式、时域编码向频域编码切换编码方式或者频域编码向时域编码切换编码方式;
根据所述当前音频帧的最终编码方式对所述当前音频帧进行编码。
2.根据权利要求1所述的方法,其特征在于,所述根据所述当前音频帧的信号类型和所述当前音频帧的使用场景确定所述当前音频帧的初始编码方式,包括:
当所述当前音频帧的信号类型为音乐类型,且所述使用场景为低延时场景时,确定所述当前音频帧的初始编码方式为时域编码方式;或者,
当所述当前音频帧的信号类型为音乐类型,且所述使用场景为高音质场景时,判断所述当前音频帧是否为时域平稳信号;若所述当前音频帧是时域平稳信号,则确定所述当前音频帧的初始编码方式为频域编码方式;或者,若所述当前音频帧不是时域平稳信号,则确定所述当前音频帧的初始编码方式为时域编码方式。
3.根据权利要求2所述的方法,其特征在于,所述判断所述当前音频帧是否为时域平稳信号,包括:
将所述当前音频帧拆分为多个音频子帧;
计算所述多个音频子帧的能量方差;
当所述多个音频子帧的能量方差大于第一设定阈值时,采用线性预测编码LPC的滤波器对所述音频帧进行滤波得到滤波后的音频帧的能量,根据所述滤波后的音频帧的能量确定所述音频帧是否为所述时域平稳信号;
当所述多个音频子帧的能量方差小于所述第一设定阈值时,采用改进的离散余弦变换MDCT对所述音频帧进行变换得到变换后的音频帧的各个频点的能量方差,根据所述变换后的音频帧的各个频点的能量方差确定所述音频帧是否为所述时域平稳信号。
4.根据权利要求3所述的方法,其特征在于,所述根据所述滤波后的音频帧的能量确定所述音频帧是否为所述时域平稳信号,包括:
若所述滤波后的音频帧的能量与所述音频帧的能量之比大于第二设定阈值时,则所述音频帧是所述时域平稳信号;若所述滤波后的所述音频帧的能量与所述音频帧的能量之比小于所述第二设定阈值时,则所述音频帧不是所述时域平稳信号。
5.根据权利要求3所述的方法,其特征在于,所述根据所述变换后的音频帧的各个频点的能量方差确定所述音频帧是否为所述时域平稳信号,包括:
若所述变换后的音频帧的各个频点的能量方差大于第三设定阈值,则所述音频帧是所述时域平稳信号;若所述变换后的音频帧的各个频点的能量方差小于所述第三设定阈值,则所述音频帧不是所述时域平稳信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011004241.5/1.html,转载请声明来源钻瓜专利网。