[发明专利]音频编码方法及装置、电子设备、存储介质有效

申请号：	202010383119.7	申请日：	2020-05-08
公开（公告）号：	CN112037803B	公开（公告）日：	2023-09-29
发明（设计）人：	闫玉凤;肖全之;黄荣均;方桂萍	申请（专利权）人：	珠海市杰理科技股份有限公司
主分类号：	G10L19/00	分类号：	G10L19/00;G10L19/16;G10L25/78
代理公司：	深圳市君之泉知识产权代理有限公司 44366	代理人：	石孟华
地址：	519075 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频编码方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种音频编码方法及装置、电子设备、存储介质，该方法包括：对待编码音频数据进行语音端点检测处理，以将待编码音频数据中的活动音频段和非活动音频段相分割；对于每一个活动音频段，利用其每一个粒度中每一子带的能量值计算其粒度平均能量；根据每一个活动音频段的粒度平均能量确定每一个活动音频段的编码码率，其中，活动音频段的编码码率与活动音频段的粒度平均能量正相关；对于每一个活动音频段，按照其编码码率对其进行音频编码；对待编码音频数据分割得到的非活动音频段进行编码，且每一个活动音频段的编码码率大于每一个非活动音频段的编码码率。本发明能够有利于提高编码质量，减少编码后的音频失真。

技术领域

本发明涉及音频编码技术领域，尤其涉及一种音频编码方法及装置、电子设备、存储介质。

背景技术

目前，为了便于音频的网络传输和存储，通常需要采用音频编码技术将原始音频数据转换为压缩数据，压缩后的数据数据量更少，从而有利于节省存储空间以及减少网络传输所需要的网络带宽，但是，通常情况下，编码后容易造成音频失真。

发明内容

基于上述现状，本发明的主要目的在于提供一种音频编码方法及装置、电子设备、存储介质，有利于减少编码后的音频失真。

为实现上述目的，本发明的技术方案提供了一种音频编码方法，包括：

步骤S1：对待编码音频数据进行语音端点检测处理，以将所述待编码音频数据中的活动音频段和非活动音频段相分割，得到若干音频段；

步骤S2：对每一个所述活动音频段进行分块处理得到若干个粒度，再对每一个粒度进行子带分解并计算每一个粒度中每一子带的能量值，之后对于每一个所述活动音频段，利用其每一个粒度中每一子带的能量值计算其粒度平均能量；

步骤S3：根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率，其中，活动音频段的编码码率与活动音频段的粒度平均能量正相关；

步骤S4：对于每一个所述活动音频段，按照其编码码率对其进行音频编码；

步骤S5：对所述待编码音频数据分割得到的非活动音频段进行编码，且每一个所述活动音频段的编码码率大于每一个所述非活动音频段的编码码率。

进一步地，步骤S2包括：

步骤S21：对所述待编码音频数据分割得到的第k个活动音频段进行分块处理，得到若干个粒度，k＝1,2,3,…,L，L为所述待编码音频数据分割得到的活动音频段的数量；

步骤S22：对所述第k个活动音频段的每一个粒度进行子带分解操作，然后对于所述第k个活动音频段的每一个粒度，计算其每一子带的能量值；

其中，W_(k,i)[sb]为所述第k个活动音频段的第i个粒度中第sb子带的能量值，SP_(k,i)[sb][j]为所述第k个活动音频段的第i个粒度中第sb子带的第j频率线的频谱值，sb表示子带号，sb＝1,2,3,…,N，N为每一个粒度中的子带数量，j表示频率线号，Z为每一子带的频率线数量，a为大于1的预设值；

步骤S23：计算所述第k个活动音频段在每一子带上的能量分布值；

其中，D_k[sb]为所述第k个活动音频段在第sb子带上的能量分布值，grs_k为所述第k个活动音频段分块处理后得到的粒度数量；

步骤S24：确定所述第k个活动音频段的粒度平均能量EDS_k；

进一步地，所述根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率，包括：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于珠海市杰理科技股份有限公司，未经珠海市杰理科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010383119.7/2.html，转载请声明来源钻瓜专利网。

上一篇：基于语音端点检测的音频编码方法及装置、设备、介质
下一篇：基于多车辆传感器融合的控制和映射

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音频编码方法及装置、电子设备、存储介质有效

专利文献下载