[发明专利]编码方法和装置、以及解码方法和装置有效
申请号: | 201180026855.6 | 申请日: | 2011-03-31 |
公开(公告)号: | CN102918590A | 公开(公告)日: | 2013-02-06 |
发明(设计)人: | 成钟模;金炫佑;裵贤珠 | 申请(专利权)人: | 韩国电子通信研究院 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 李芳华 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编码 方法 装置 以及 解码 | ||
技术领域
本发明涉及一种编码方法和设备、以及解码方法和设备,且具体地涉及使用改进离散余弦变换(MDCT)的编码/解码方法和设备。
背景技术
用于数字地传送和存储语音和音频的技术广泛地使用在无线通信和IP传送话音(VoIP)服务中,并且使用在包括传统电话网络的有线通信中。如果语音和音频信号在简单地采样并数字化之后传送,则需要例如64kbps(当以8kHz来对它们进行采样、并且利用8比特来对每个采样进行编码时)的数据率。然而,如果使用信号分析技术和恰当的编码技术,则可以以更低的数据率来传送语音。波形编码、码激励线性预测(CELP)编码、和变换编码方法广泛地用于语音和音频压缩。波形编码方案非常简单,并且以预定数目的比特来对每个采样自身的幅度或者每个采样与先前采样之间的差异进行编码,但是需要更高的比特率。CELP编码方案基于语音产生模型,并且利用线性预测滤波器和激励信号来对语音进行建模。它可以按照相对较低的速率压缩语音,但是它在音频信号上的性能受到劣化。变换编码方案将时域语音信号变换为频域信号,并然后对与每个频率分量对应的变换系数进行编码。典型地,它可以使用人类的听觉特性来对每个频率分量进行编码。
用于通信的语音编解码器已经从传统电话带宽的窄带编码演进到能够提供更好自然度和清晰度的宽带或超宽带编码。在单一编解码器中支持多比特率的多速率编解码器广泛地用于适配各种网络环境。此外,已经开发出嵌入式可变比特率编解码器,以按照嵌入式方式来提供用于采纳具有各种带宽的信号的带宽可伸缩性和比特率可伸缩性。对嵌入式可变比特率编解码器进行配置,使得较高比特率的比特流包含较低比特率的比特流。通常,它采纳分级编码方案。当信号带宽增加时,还将用于音频信号(诸如,音乐)的编解码器的质量认为是重要因素。相应地,使用混合编码方案,其中将整个信号带宽划分为两个子带信号,使得将波形编码方案或CELP编码方案应用于较低频带信号,并且将变换编码方案应用于较高频带信号。照这样,变换编码方案被广泛地使用在用于支持宽带或超宽带的通信的语音编解码器、以及传统的音频编解码器中。
在变换编码方案中,需要将时域信号变换为频域信号。在大多数情况下,使用改进离散余弦变换(MDCT)。变换编解码器的质量遭受由编解码器的有限比特率导致的MDCT系数的量化误差。为了解决这个问题,可以使用以下方法,其用于通过添加具有相对低比特率的增强层来减少MDCT量化误差。
在此情况下,由于向MDCT系数动态分配的比特数目仅仅取决于所量化MDCT系数的绝对值,所以通过内核层的MDCT量化性能来确定内核层和增强层的整体量化性能。然而,当在某一MDCT系数中出现大的量化误差并且所量化MDCT系数的幅度小于其他系数的幅度时,向该MDCT系数分配较少的比特,使得无法有效地补偿该大量化误差。
发明内容
技术问题
本发明的各方面提供了一种用于有效地补偿量化误差的编码/解码方法和设备。
技术方案
根据本发明的一方面,提供了一种编码器的MDCT编码方法。该编码方法包括:对输入信号进行变换,以生成第一改进离散余弦变换(MDCT)系数;对所述第一MDCT系数进行量化,以生成MDCT索引;对所述MDCT索引进行反量化,以生成第二MDCT系数;使用所述第一MDCT系数与所述第二MDCT系数之间的差异来计算MDCT残差系数;对所述MDCT残差系数进行编码,以生成残差索引;以及根据所述第一MDCT系数和所述第二MDCT系数来生成与所述第一MDCT系数的增益对应的增益索引。
该编码方法还可以包括:对所述MDCT索引、该残差索引和所述增益索引进行多路复用,以生成比特流。
生成残差索引的步骤可以包括:选择多个子带之中、具有MDCT残差系数的最大能量的子带的索引;以及通过对所选择的索引进行编码来生成子带索引。该残差索引可以包括该子带索引。
可以将第j个子带的MDCT残差系数的能量计算为这里,uj和lj分别是第j个子带的下边界索引和上边界索引,并且E(k)是第k个MDCT残差系数。
生成残差索引的步骤还可以包括:对所选择子带的MDCT残差系数进行编码。
对MDCT残差系数进行编码的步骤还可以包括:对用于所选择子带的MDCT残差系数的多个轨道进行配置;选择以下脉冲,该脉冲对应于与每个轨道中可能位置对应的MDCT残差系数之中、具有最大绝对值的预定数目的MDCT残差系数;以及对该脉冲进行编码。该残差索引还可以包括该脉冲的编码值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩国电子通信研究院,未经韩国电子通信研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180026855.6/2.html,转载请声明来源钻瓜专利网。