[发明专利]音频编码方法及装置、电子设备、存储介质有效
申请号: | 202010383119.7 | 申请日: | 2020-05-08 |
公开(公告)号: | CN112037803B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 闫玉凤;肖全之;黄荣均;方桂萍 | 申请(专利权)人: | 珠海市杰理科技股份有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/16;G10L25/78 |
代理公司: | 深圳市君之泉知识产权代理有限公司 44366 | 代理人: | 石孟华 |
地址: | 519075 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 编码 方法 装置 电子设备 存储 介质 | ||
本发明提供了一种音频编码方法及装置、电子设备、存储介质,该方法包括:对待编码音频数据进行语音端点检测处理,以将待编码音频数据中的活动音频段和非活动音频段相分割;对于每一个活动音频段,利用其每一个粒度中每一子带的能量值计算其粒度平均能量;根据每一个活动音频段的粒度平均能量确定每一个活动音频段的编码码率,其中,活动音频段的编码码率与活动音频段的粒度平均能量正相关;对于每一个活动音频段,按照其编码码率对其进行音频编码;对待编码音频数据分割得到的非活动音频段进行编码,且每一个活动音频段的编码码率大于每一个非活动音频段的编码码率。本发明能够有利于提高编码质量,减少编码后的音频失真。
技术领域
本发明涉及音频编码技术领域,尤其涉及一种音频编码方法及装置、电子设备、存储介质。
背景技术
目前,为了便于音频的网络传输和存储,通常需要采用音频编码技术将原始音频数据转换为压缩数据,压缩后的数据数据量更少,从而有利于节省存储空间以及减少网络传输所需要的网络带宽,但是,通常情况下,编码后容易造成音频失真。
发明内容
基于上述现状,本发明的主要目的在于提供一种音频编码方法及装置、电子设备、存储介质,有利于减少编码后的音频失真。
为实现上述目的,本发明的技术方案提供了一种音频编码方法,包括:
步骤S1:对待编码音频数据进行语音端点检测处理,以将所述待编码音频数据中的活动音频段和非活动音频段相分割,得到若干音频段;
步骤S2:对每一个所述活动音频段进行分块处理得到若干个粒度,再对每一个粒度进行子带分解并计算每一个粒度中每一子带的能量值,之后对于每一个所述活动音频段,利用其每一个粒度中每一子带的能量值计算其粒度平均能量;
步骤S3:根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率,其中,活动音频段的编码码率与活动音频段的粒度平均能量正相关;
步骤S4:对于每一个所述活动音频段,按照其编码码率对其进行音频编码;
步骤S5:对所述待编码音频数据分割得到的非活动音频段进行编码,且每一个所述活动音频段的编码码率大于每一个所述非活动音频段的编码码率。
进一步地,步骤S2包括:
步骤S21:对所述待编码音频数据分割得到的第k个活动音频段进行分块处理,得到若干个粒度,k=1,2,3,…,L,L为所述待编码音频数据分割得到的活动音频段的数量;
步骤S22:对所述第k个活动音频段的每一个粒度进行子带分解操作,然后对于所述第k个活动音频段的每一个粒度,计算其每一子带的能量值;
其中,W(k,i)[sb]为所述第k个活动音频段的第i个粒度中第sb子带的能量值,SP(k,i)[sb][j]为所述第k个活动音频段的第i个粒度中第sb子带的第j频率线的频谱值,sb表示子带号,sb=1,2,3,…,N,N为每一个粒度中的子带数量,j表示频率线号,Z为每一子带的频率线数量,a为大于1的预设值;
步骤S23:计算所述第k个活动音频段在每一子带上的能量分布值;
其中,Dk[sb]为所述第k个活动音频段在第sb子带上的能量分布值,grs_k为所述第k个活动音频段分块处理后得到的粒度数量;
步骤S24:确定所述第k个活动音频段的粒度平均能量EDSk;
进一步地,所述根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海市杰理科技股份有限公司,未经珠海市杰理科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010383119.7/2.html,转载请声明来源钻瓜专利网。