[发明专利]音频压缩方法和装置有效
申请号: | 201910633760.9 | 申请日: | 2019-07-15 |
公开(公告)号: | CN110390939B | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 方桂萍;闫玉凤;肖全之 | 申请(专利权)人: | 珠海市杰理科技股份有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/02;G10L19/04;G10L19/26 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 王珊珊 |
地址: | 519085 广东省珠海市吉*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 压缩 方法 装置 | ||
本申请涉及一种音频压缩方法和装置,计算机设备对待压缩音频进行分帧处理,获得各音频帧;当音频帧为周期信号时,提取音频帧的音素特征,并将音素特征满足预设匹配条件的至少一个音频帧确定为一个压缩单元,以及确定压缩单元中的一个关键音频帧;然后,基于预设的音频压缩格式对压缩单元进行压缩,获得压缩单元的压缩数据;其中,上述音频压缩数据包括关键波形参数,关键波形参数用于表征关键音频帧的一个周期波形。采用上述方法可以大大提升了音频压缩的压缩比。
技术领域
本申请涉及音频编码技术领域,特别是涉及一种音频压缩方法和装置。
背景技术
音频压缩技术指的是对原始数字音频信号流运用适当的数字信号处理技术,在不损失有用信息量或所引入损失可忽略的条件下,降低其码率,也称为压缩编码。音频压缩主要有两种压缩方式,分别是有损压缩和无损压缩。有损压缩顾名思义就是降低音频采样频率与比特率,输出的音频文件会比原文件小。另一种音频压缩被称为无损压缩,其能够在100%保存原文件的所有数据的前提下,将音频文件的体积压缩的更小,而将压缩后的音频文件还原后,能够实现与源文件相同的大小、相同的码率。
传统技术中,主要是通过逼近原波形的方法对音频文件进行去冗余处理,来获得音频文件的压缩数据。
但是,在一些应用场景中,例如,只需要音频文件中的语音内容的情况下,而不需要去逼近原音频文件的波形时,通过上述方法得到的压缩比不能满足实际需求。
发明内容
基于此,有必要针对上述技术问题,提供一种音频压缩方法和装置。
一种音频压缩方法,上述方法包括:
对待压缩音频进行分帧处理,获得各音频帧;
当音频帧为周期信号时,提取音频帧的音素特征,并将音素特征满足预设匹配条件的至少一个音频帧确定为一个压缩单元,以及确定压缩单元中的一个关键音频帧;
基于预设的音频压缩格式对压缩单元进行压缩,获得压缩单元的压缩数据;音频压缩数据包括关键波形参数,关键波形参数用于表征关键音频帧的一个周期波形。
在其中一个实施例中,上述关键波形参数包括对关键音频帧的一个周期波形进行线性预测压缩,获得的线性拟合系数和残差信号。
在其中一个实施例中,上述音频压缩数据还包括压缩单元中第一个音频帧的第一周期、压缩单元中第一个音频帧的第一能量值、压缩单元中后一个音频帧的周期与前一个音频帧的周期之间的第一差值,以及压缩单元中后一个的能量值和前一个音频帧的能量值之间的第二差值。
在其中一个实施例中,上述提取音频帧的音素特征,包括:
提取音频帧的单个周期波形;
根据单个周期波形确定音频帧的共振峰频率,并将共振峰频率确定为音素特征。
在其中一个实施例中,上述将音素特征满足预设匹配条件的至少一个音频帧确定为一个压缩单元,包括:
在预设帧数内,依次比较相邻两个音频帧的共振峰频率;
当相邻两个音频帧的共振峰频率的差值小于预设频率差值时,确定相邻两个音频帧满足预设匹配条件;
将连续满足预设匹配条件的音频帧确定为一个压缩单元。
在其中一个实施例中,上述预设帧数为7。
在其中一个实施例中,上述确定压缩单元中的一个关键音频帧,包括:
在压缩单元内的各音频帧对应的音频波形上查找各音频帧对应的最大波峰值,并根据各个最大波峰值获得各音频帧的能量值;
将压缩单元内能量值最大的音频帧确定为关键音频帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海市杰理科技股份有限公司,未经珠海市杰理科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910633760.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于声纹的语音处理方法、装置和终端设备
- 下一篇:音频分发系统