[发明专利]语音频码流的解码方法及装置有效

申请号：	201310751997.X	申请日：	2013-12-31
公开（公告）号：	CN104751849A	公开（公告）日：	2015-07-01
发明（设计）人：	刘泽新;张兴涛;苗磊	申请（专利权）人：	华为技术有限公司
主分类号：	G10L19/008	分类号：	G10L19/008;G10L19/16
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	杨伦
地址：	518129 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音频码流解码方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及音频解码技术，具体涉及语音频码流解码方法及装置。

背景技术

在移动通信业务中，由于网络丢包以及时延抖动，不可避免的会造成丢帧，导致某些语音频信号不能通过解码的参数恢复出来，只能通过帧擦除隐藏（FEC：Frame Erasure Concealment）技术恢复。然而，对丢包率较高的情况，仅仅通过解码端的FEC技术，输出的语音频信号的质量较差，不能满足高质量通信的需求。

为了更好的降低语音频帧丢失导致的质量下降问题，产生了冗余编码算法：在编码端，除了用一定的比特率编码当前帧的信息外，还用较低比特率编码除当前帧之外其他帧的信息，并将较低比特率的码流作为冗余码流信息和当前帧的信息的码流一起传输到解码端。在解码端，当当前帧丢失时，如果抖动缓冲器（jitter buffer）里或已收到的码流里存储了包含当前帧的冗余码流信息，则可以根据该冗余码流信息恢复当前帧，从而改善恢复出的语音频信号的质量。只有在没有当前帧的冗余码流信息时才基于FEC技术恢复当前帧。

从上可知，在现有的冗余编码算法中，冗余码流信息是使用较低的码率编码得到的，因此可能会造成信号不稳定，从而导致输出的语音频信号的质量不高。

发明内容

本发明实施例提供了语音频码流的音频的冗余解码方法及装置，能够提高输出语音频信号的质量。

第一方面，提供了一种语音频码流的解码方法，包括：

判断当前帧是否为正常解码帧或冗余解码帧；

如果所述当前帧为正常解码帧或冗余解码帧，解析获得当前帧的解码参数；

对所述当前帧的解码参数进行后处理，获得当前帧的后处理的解码参数；

使用当前帧的后处理的解码参数恢复语音频信号。

结合第一方面，在第一方面的第一种实现方式中，所述当前帧的解码参数包括当前帧的频谱对参数，所述对所述当前帧的解码参数进行后处理包括：

使用当前帧的频谱对参数和当前帧的前一帧频谱对参数获得当前帧的后处理的频谱对参数。

结合第一方面的第一种实现方式，在第一方面的第二种实现方式中，具体使用如下公式计算获得当前帧的后处理的频谱对参数：

lsp[k]=α*lsp_old[k]+δ*lsp_new[k] 0≤k≤M

lsp[k]为当前帧的后处理的频谱对参数，lsp_old[k]为前一帧的频谱对参数，lsp_new[k]为当前帧的频谱对参数，M为频谱对参数的阶数，α为前一帧的频谱对参数的权重和δ为当前帧的频谱对参数的权重，α≥0，δ≥0，且α+δ=1。

结合第一方面的第一种实现方式，在第一方面的第三种实现方式中，具体使用如下公式计算获得当前帧的后处理的频谱对参数：

lsp[k]=α*lsp_old[k]+β*lsp_mid[k]+δ*lsp_new[k] 0≤k≤M；

lsp[k]为当前帧的后处理的频谱对参数，lsp_old[k]为前一帧的频谱对参数，lsp_mid[k]为当前帧的频谱对参数的中间值，lsp_new[k]为当前帧的频谱对参数，M为频谱对参数的阶数，α为前一帧的频谱对参数的权重，β为当前帧的频谱对参数的中间值的权重和δ为当前帧的频谱对参数的权重，α≥0，β≥0，δ≥0，且α+β+δ=1。

结合第一方面的第三种实现方式，在第一方面的第四种实现方式中，在所述当前帧为冗余解码帧，且当前帧的信号类型不为清音时，如果当前帧的后一帧的信号类型为清音，或者当前帧的前一帧的谱倾斜因子小于预设的谱倾斜因子门限值，或者当前帧的后一帧的信号类型为清音且当前帧的前一帧的谱倾斜因子小于预设的谱倾斜因子门限值，β的取值为0或小于预设的门限值。

结合第一方面的第二至四种实现方式中的任何一种，在第一方面的第五种实现方式中，在所述当前帧的信号类型为清音，所述当前帧的前一帧为冗余解码帧，且所述当前帧的前一帧的信号类型不为清音时，α的取值为0或小于预设的门限值。

结合第一方面的第二至五种实现方式中的任何一种，在第一方面的第六种实现方式中，在所述当前帧为冗余解码帧，且当前帧的信号类型不为清音时，如果当前帧的后一帧的信号类型为清音，或者当前帧的前一帧的谱倾斜因子小于预设的谱倾斜因子门限值，或者当前帧的后一帧的信号类型为清音且当前帧的前一帧的谱倾斜因子小于预设的谱倾斜因子门限值，δ的取值为0或小于预设的门限值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华为技术有限公司，未经华为技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310751997.X/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音频码流的解码方法及装置有效

专利文献下载