[发明专利]一种音频带宽扩展的方法及扩展装置有效
申请号: | 201610973582.0 | 申请日: | 2016-11-01 |
公开(公告)号: | CN107221334B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 胡瑞敏;姜林;文彬;王晓晨;江游 | 申请(专利权)人: | 武汉大学深圳研究院 |
主分类号: | G10L19/00 | 分类号: | G10L19/00 |
代理公司: | 广州高炬知识产权代理有限公司 44376 | 代理人: | 孙明科 |
地址: | 518000 广东省深圳市南山区高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 带宽 扩展 方法 装置 | ||
本发明公开了一种音频带宽扩展的方法及扩展装置,方法包括检测当前帧信号在混合ACELP/TVC核心编码器中的编码模式来区分信号类型;基于信号类型分别对语音和音乐信号选择自适应的高频重建策略;若为语音信号,则采用基于LPC的带宽扩展方法;若为音乐信号,则采用基于高低频信号相关性的频带复制带宽扩展方法。扩展装置包括信号类型检测模块、语音信号带宽扩展模块和音乐信号带宽扩展模块。本发明充分考虑到了不同信号类型的特性,从信号类型的角度着手,以提高音频恢复质量,能够更准确的进行高频重建。
技术领域
本发明涉及音频编码领域,具体是一种音频带宽扩展的方法及扩展装置。
背景技术
心理声学研究表明人们对于音频不同频率下的敏感性具有差异,对低频更敏感而对高频不敏感,因此在音频编码中常常不对高频进行编码以节省码率。而高频部分的完全缺失又会带来听感上的不适,因此往往采用带宽扩展的方式恢复高频。基于LPC的带宽扩展技术是目前低码率、低复杂度的代表技术。它通过提取表征高频包络的LPC参数,子带能量,然后对得到高频的低频信号进行调整,从而完成高频重建。我国自主研发的移动音频编解码器AVS-P10也采用了这种带宽扩展方法。
在对现有方法的研究和实践中,存在以下弊端:算法中对于信号的高频部分统一通过基于语音产生原理的LPC的带宽扩展算法进行编码,通过将低频信号的残差信号作为高频激励并结合线性预测编码技术实现高频的重建。从原理上来看,AVS-P10带宽扩展技术采用的一种典型的参数编码技术。其对语音信号的高频重建具有良好的效果,而对音乐信号的高频重建效果不佳,不能根据信号的类型与特征做自适应的调整。
发明内容
本发明的目的在于提供一种音频带宽扩展的方法及扩展装置,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种音频带宽扩展的方法,包括如下步骤:
步骤1,通过检测当前帧信号在混合ACELP/TVC核心编码器中的编码模式来区分信号类型;
若当前帧信号在核心编码器的编码模式为ACELP256,则当前帧为语音信号;
若当前帧信号在核心编码器的编码模式为TVC256、TVC512、TVC1024,则当前帧为音乐信号;
步骤2,同时基于信号类型分别对语音和音乐信号选择自适应的高频重建策略;
若为语音信号,则采用基于LPC的带宽扩展方法;
若为音乐信号,则采用基于高低频信号相关性的频带复制带宽扩展方法。
作为本发明进一步方案:所述对于语音信号,采用基于LPC的带宽扩展方法具体为:
(1)提取低频残差信号作为激励信号;
低带原始信号经过低带线性预测逆滤波器滤波后得到低带残差信号作为激励信号,低带的线性预测系数每帧更新一次;每一个1024样点超帧的低带激励信号通过长度为288样点,重叠区域为32样点的余弦窗分割为四个长度288样点的帧
(2)提取高频LPC系数,表征高频包络信息;
对每一帧高频原始信号进行一次八阶线性预测分析,得到一组八阶的线性预测编码系数,并转换为导抗频谱对系数,导抗频谱对系数进一步变换为导抗谱频率系数;量化后的导抗谱频率系数变换为量化后线性预测系数,并以此产生高频合成滤波器;假设高频合成滤波器288点的冲击响应为,用288点的快速傅里叶变换将变换到频域,以此表示原始高频信号的频谱包络;
(3)利用高频包络信息和低频残差信号得到准高频信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学深圳研究院,未经武汉大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610973582.0/2.html,转载请声明来源钻瓜专利网。