[发明专利]音频编码方法及装置和音频解码方法及装置有效
申请号: | 200810223444.6 | 申请日: | 2008-09-27 |
公开(公告)号: | CN101685637A | 公开(公告)日: | 2010-03-31 |
发明(设计)人: | 陈龙吟;肖玮;苗磊;刘泽新;胡晨;哈维·米希尔·塔迪;张清 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 北京同立钧成知识产权代理有限公司 | 代理人: | 刘 芳 |
地址: | 518129广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 编码 方法 装置 解码 | ||
技术领域
本发明涉及编解码技术领域,尤其涉及一种音频编码方法及装置和音频解码方法及装置。
背景技术
随着编解码技术的不断发展,变换域编解码成为语音频编码中的一种常用编码技术,所谓变换域编解码就是将输入的信号经过时-频变换从时域转换到频域,得到一组频域系数,对频域系数进行量化编码并传递到解码端;解码端解码出这些频域系数的量化值,并通过频-时变换得到原信号的近似表示。在语音频编解码领域使用最为广泛的变换方法是修正的离散余弦变换(Modified Discrete Cosine Transform,MDCT)。采用MDCT变换,输入信号经过MDCT变换后得到一组MDCT系数,受传输速率的影响,不可能对每个系数分配多个比特进行编码。因此,一般处理方法是将连续的多个MDCT系数合并成一个矢量(如8维矢量),进行矢量量化。
随着通信技术的发展,语音频编解码器的标准化活动的趋势由几年前的由窄带扩展为宽带,由宽带扩展为超宽带甚至全带。基于格形矢量量化(Lattice Vector Quantization,LVQ)的编码方法是一种比较适合超宽带或全带扩展需求的编码方式。然而,超宽带以上的信号特征较窄带、宽带差别很大,如:超宽带以上信号存在大量的能量相对较小的频率成份,这些频率成份的存在能够让声音更加自然、饱满。
在现有的语音频编解码器中,应用比较广泛的方法是将连续多个MDCT系数合并成一个矢量,进行矢量量化,LVQ对于码本空间进行规则的划分,若采用LVQ,系统只需存贮少量的码本(在LVQ技术中称为绝对引导项),通过绝对引导项的位置和各分量中符号位的排列组合可以衍生出多个矢量。编码端仅需将当前被量化的MDCT系数矢量的量化索引值(该索引值记录了绝对引导项的排列组合信息)传递出去;解码接收到该索引值就可以恢复出矢量的量化值,完成解码。在LVQ量化前,编码器需要对输入的MDCT系数矢量除以归一化因子,以方便后续的处理流程;在AMR WB+中,首先在频域计算一个统一的增益值,然后每个MDCT系数矢量均除以该增益值完成归一化流程。在宽带编码器中,这种方法也是比较适用的。
但是发明人在实施上述技术方案的过程中发现:上述方案存在一些缺陷,例如在超宽带扩展部分,处理的对象都是些小能量MDCT系数矢量。若采用AMR WB+中的统一增益处理方式,会出现两种情况:(1)使用较大的统一增益值,可以保证编码效率,但出现大量的小能量MDCT系数被直接量化成零;即使未全被置为零,也仅仅是少数几种脉冲的排列组合,量化精度不高。(2)使用较小的统一增益值,可以保证精度,但会出现编码效率较低,且如果高频带能量集中于某一连续的频域,仍会造成其他能量较小的连续频域的系数全部量化为零,会影响所有码率的音质。
发明内容
本发明实施例提供一种音频编码方法和装置及音频解码方法和装置,以保证编解码效率和编解码精度,从而避免在超宽带扩展部分连续的子带被量化成零和子带精度过低的情况出现。
本发明实施例提供一种音频编码方法,该音频编码方法包括:
对输入的信号进行处理,依次输出第一码流和第二码流,其中,第二码流包含频域参数信息,所述频域参数信息是将从编码端输入的信号中分离出的高带信号进行时频转换后进行频带扩展编码获取的;
利用第二码流包含的频域参数信息计算伸缩系数,并利用频域参数信息和伸缩系数对所述输入的信号经时频变换后的频域系数进行频域系数编码输出第三码流;
将所述第一码流、第二码流和第三码流进行复用输出码流。
本发明实施例提供一种音频编码装置,该音频编码装置包括:
处理单元,用于对输入的信号进行处理,依次输出第一码流和第二码流,其中,第二码流包含频域参数信息,所述频域参数信息是将从编码端输入的信号中分离出的高带信号进行时频转换后进行频带扩展编码获取的;
编码单元,用于利用第二码流包含的频域参数信息计算伸缩系数,并利用频域参数信息和伸缩系数对所述输入的信号经时频变换后的频域系数进行频域系数编码输出第三码流;
复用单元,用于将所述第一码流、第二码流和第三码流进行复用输出码流。
本发明实施例提供一种音频解码方法,该音频解码方法包括:
对输入的码流进行解复用,分离出第一码流、第二码流和第三码流;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810223444.6/2.html,转载请声明来源钻瓜专利网。