[发明专利]一种相邻高低速率编码模式间切换的变速率音频编码方法有效

专利信息
申请号: 201110180050.9 申请日: 2011-06-29
公开(公告)号: CN102254562A 公开(公告)日: 2011-11-23
发明(设计)人: 王晶;杨果;孟凯;赵胜辉 申请(专利权)人: 北京理工大学
主分类号: G10L19/12 分类号: G10L19/12
代理公司: 暂无信息 代理人: 暂无信息
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 相邻 高低 速率 编码 模式 切换 音频 方法
【说明书】:

技术领域

本发明涉及一种相邻高低速率编码模式间切换的变速率音频编码方法,尤其是适合于包含多种编码速率的音频编码器,属于音频编码领域。

背景技术

变速率的音频编码技术是根据输入音频信号的统计特性,或者通信链路质量,或者网络用户的需求来控制信息传输速率,从而降低传输的平均码率,提高传输效率,它相对于传统的固定速率编码方法能够更好的节省信道带宽,受到研究者的广泛重视。一般而言,变速率的语音编码算法可以分为信源控制的或信道控制的两大类,后者可以是信道或网络控制编码速率可变,通常是根据外部控制信号从一种速率切换为预定速率集合中的另一种速率,如AMR自适应多速率语音编码,也可以是可分级的编解码方式。信源控制的变速率编码方法则是根据输入信号的特性来动态的分配编码比特或采用不同的编码模式,其编码器的目的是为了确保输出信号质量的同时给每帧音频信号分配尽可能少的比特,如3GPP2标准中提出的SMV可选模式声码器。

目前变速率编码的方法大多用于基于线性预测和码本激励的语音编码器,例如我国专利申请号为200810210215(公开日:2009年03月18日)和申请专利号为200710153938(公开日:2009年02月04日)的发明专利提出了根据合成数字话音帧的话音激活检测结果或者清浊音检测结果来确定编码速率的变速率码激励线性预测编码器和编码方法。后期产生了多模式变速率方法,它是针对不同特性的输入信号帧设计最佳的编码模式和分配最低的编码速率,并使编码器能够保持较好的解码声音质量。通常有两种技术可以实现多模式变速率,一种是闭环方式,一种是开环方式。前者基于某种失真准则通过闭环搜索判断哪种模式最适合当前帧编码,当选择合适的失真准则时能够使得语音帧和编码模式达到最佳匹配,后者通常基于语音帧分类的方式,对不同类的语音帧采用不同的编码模式或编码速率,以达到编码比特有效分配的效果。开环方式的复杂度较低,但需要鲁棒性较高的语音帧分类算法,闭环的计算复杂度较高,但编码模式匹配效果较好。VAD话音激活检测技术是变速率语音编码器中常用的方法,它通过降低语音静默段的量化编码比特从而大大降低整体编码速率,但在音乐信号的编码中并不适用,音乐信号不像语音信号在通话过程中存在50%左右的静默段,可以利用VAD技术来降低静默段的编码速率。3GPP2标准中提出的EVRC增强型可变速率编码器和SMV可选模式声码器都是基于语音帧分类的方式来确定每帧的量化编码方式和编码速率,从而达到整体编码速率的降低。

而3GPP标准中的AMR-NB(TS 26.090)、AMR-WB(TS 26.190)则是根据信道传输的恶劣情况来从预定的多种速率中选择合适的编码速率传输窄带或宽带语音,AMR-WB+(TS 26.290)则是一种在AMR-WB基础上发展的自适应多速率的语音和音乐混合编码方法,在编码之前首先确定编码速率,对于每帧音频信号再选择合适的ACELP(代数码本激励)或TCX(Transform Coded Excitation)变换码激励编码模式,ACELP倾向于编码语音帧,TCX倾向于编码音频帧,对于每帧输入音频信号,从26种ACELP/TCX组合编码模式中选择最佳的编码模式。我国AVS数字音视频编码标准工作组提出的AVS-P10是多速率的移动语音和音频混合的编解码器,与AMR-WB+的编解码原理相似,其核心模块的编码方式有所不同,AVS-P10核心模块采用ACELP/TVC(Transform Vector Coding,变换域矢量编码),两者的单声道编码速率都有8种速率,立体声编码速率都有16种速率,两者均是信道控制的变速率编码,而没有采用信源控制变速率编码方法,尤其对音乐信号未有合适的源控变速率方式。

发明内容

本发明的目的是为了进一步提高多速率音频编码器的编码效率,压缩编码带宽,利用闭环源控变速率的方式降低某些音频帧的编码速率,通过设计合适的闭环选择准则从而达到整体的平均编码速率的降低。

为了实现上述目的,本发明采用的技术方案是:首先对每帧音频信号在高速率下进行编解码,将该速率下各种编码模式的编码输入信号和解码输出信号通过感知加权滤波器后计算平均分段信噪比,并选出使感知加权平均分段信噪比最大的编码模式,然后在临近高速率的低编码速率下选出使编码输入信号和解码输出信号的感知加权平均分段信噪比最大的编码模式,最后分别对于高、低速率下选出来的编码模式,计算编码输入信号和解码输出信号平均分段信噪比,如果低速率编码模式下的平均分段信噪比相比高速率编码模式下的偏大,则切换到低速率编码模式,反之则切换到高速率编码模式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110180050.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top