[发明专利]语音频码流的解码方法及装置有效
申请号: | 201310751997.X | 申请日: | 2013-12-31 |
公开(公告)号: | CN104751849A | 公开(公告)日: | 2015-07-01 |
发明(设计)人: | 刘泽新;张兴涛;苗磊 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L19/16 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 杨伦 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 频码流 解码 方法 装置 | ||
技术领域
本发明涉及音频解码技术,具体涉及语音频码流解码方法及装置。
背景技术
在移动通信业务中,由于网络丢包以及时延抖动,不可避免的会造成丢帧,导致某些语音频信号不能通过解码的参数恢复出来,只能通过帧擦除隐藏(FEC:Frame Erasure Concealment)技术恢复。然而,对丢包率较高的情况,仅仅通过解码端的FEC技术,输出的语音频信号的质量较差,不能满足高质量通信的需求。
为了更好的降低语音频帧丢失导致的质量下降问题,产生了冗余编码算法:在编码端,除了用一定的比特率编码当前帧的信息外,还用较低比特率编码除当前帧之外其他帧的信息,并将较低比特率的码流作为冗余码流信息和当前帧的信息的码流一起传输到解码端。在解码端,当当前帧丢失时,如果抖动缓冲器(jitter buffer)里或已收到的码流里存储了包含当前帧的冗余码流信息,则可以根据该冗余码流信息恢复当前帧,从而改善恢复出的语音频信号的质量。只有在没有当前帧的冗余码流信息时才基于FEC技术恢复当前帧。
从上可知,在现有的冗余编码算法中,冗余码流信息是使用较低的码率编码得到的,因此可能会造成信号不稳定,从而导致输出的语音频信号的质量不高。
发明内容
本发明实施例提供了语音频码流的音频的冗余解码方法及装置,能够提高输出语音频信号的质量。
第一方面,提供了一种语音频码流的解码方法,包括:
判断当前帧是否为正常解码帧或冗余解码帧;
如果所述当前帧为正常解码帧或冗余解码帧,解析获得当前帧的解码参数;
对所述当前帧的解码参数进行后处理,获得当前帧的后处理的解码参数;
使用当前帧的后处理的解码参数恢复语音频信号。
结合第一方面,在第一方面的第一种实现方式中,所述当前帧的解码参数包括当前帧的频谱对参数,所述对所述当前帧的解码参数进行后处理包括:
使用当前帧的频谱对参数和当前帧的前一帧频谱对参数获得当前帧的后处理的频谱对参数。
结合第一方面的第一种实现方式,在第一方面的第二种实现方式中,具体使用如下公式计算获得当前帧的后处理的频谱对参数:
lsp[k]=α*lsp_old[k]+δ*lsp_new[k] 0≤k≤M
lsp[k]为当前帧的后处理的频谱对参数,lsp_old[k]为前一帧的频谱对参数,lsp_new[k]为当前帧的频谱对参数,M为频谱对参数的阶数,α为前一帧的频谱对参数的权重和δ为当前帧的频谱对参数的权重,α≥0,δ≥0,且α+δ=1。
结合第一方面的第一种实现方式,在第一方面的第三种实现方式中,具体使用如下公式计算获得当前帧的后处理的频谱对参数:
lsp[k]=α*lsp_old[k]+β*lsp_mid[k]+δ*lsp_new[k] 0≤k≤M;
lsp[k]为当前帧的后处理的频谱对参数,lsp_old[k]为前一帧的频谱对参数,lsp_mid[k]为当前帧的频谱对参数的中间值,lsp_new[k]为当前帧的频谱对参数,M为频谱对参数的阶数,α为前一帧的频谱对参数的权重,β为当前帧的频谱对参数的中间值的权重和δ为当前帧的频谱对参数的权重,α≥0,β≥0,δ≥0,且α+β+δ=1。
结合第一方面的第三种实现方式,在第一方面的第四种实现方式中,在所述当前帧为冗余解码帧,且当前帧的信号类型不为清音时,如果当前帧的后一帧的信号类型为清音,或者当前帧的前一帧的谱倾斜因子小于预设的谱倾斜因子门限值,或者当前帧的后一帧的信号类型为清音且当前帧的前一帧的谱倾斜因子小于预设的谱倾斜因子门限值,β的取值为0或小于预设的门限值。
结合第一方面的第二至四种实现方式中的任何一种,在第一方面的第五种实现方式中,在所述当前帧的信号类型为清音,所述当前帧的前一帧为冗余解码帧,且所述当前帧的前一帧的信号类型不为清音时,α的取值为0或小于预设的门限值。
结合第一方面的第二至五种实现方式中的任何一种,在第一方面的第六种实现方式中,在所述当前帧为冗余解码帧,且当前帧的信号类型不为清音时,如果当前帧的后一帧的信号类型为清音,或者当前帧的前一帧的谱倾斜因子小于预设的谱倾斜因子门限值,或者当前帧的后一帧的信号类型为清音且当前帧的前一帧的谱倾斜因子小于预设的谱倾斜因子门限值,δ的取值为0或小于预设的门限值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310751997.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种声音处理的方法和装置
- 下一篇:语音到文本转换的方法及装置