[发明专利]在音频编码过程中根据MDCT数据进行视窗类型判定的方法有效
申请号: | 201010268819.8 | 申请日: | 2004-09-20 |
公开(公告)号: | CN101968781A | 公开(公告)日: | 2011-02-09 |
发明(设计)人: | J·雍 | 申请(专利权)人: | 索尼电子有限公司 |
主分类号: | G06F17/14 | 分类号: | G06F17/14;G10L19/02 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李亚非;刘鹏 |
地址: | 美国新*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 编码 过程 根据 mdct 数据 进行 视窗 类型 判定 方法 | ||
本申请是申请日为2004年9月20日、中国申请号200480035333.2(国际申请号为PCT/US2004/031024)的题为“在音频编码过程中根据MDCT数据进行视窗类型判定的方法”的发明专利申请的分案申请。
技术领域
本发明总体上涉及音频编码。更具体而言,本发明涉及在音频编码过程中进行视窗类型确定。
版权标记/许可
这篇专利文件的部分公开内容包含受版权保护的材料。版权所有者不反对由出现在专利商标局专利文档或记录中的专利文件或专利公开中的任何一种的影印复制,但在别的方面却无论如何保留所有版权。将以下通告应用于如下所述的及附图中的软件和数据:Copyright2001,Sony Electronics,Inc.,All Rights Reserved。
背景技术
标准化机构运动图象专家组(MPEG)在他们的标准中公开了通用数据压缩方法,例如,所述标准诸如是MPEG-2高级音频编码(AAC)标准(参见ISO/IEC 13818-7)和MPEG-4AAC标准(参见ISO/IEC 14496-3)。这些标准在此统称为MPEG标准。
MPEG标准所定义的音频编码器接收音频信号,通过修正离散余弦变换(MDCT)运算将它转换成频谱数据,并且利用失真率控制机制来判定用于量化频谱数据的最优比例因子。音频编码器还利用最优比例因子来量化频谱数据,将所得到的量化后的频谱系数编组成比例因子带,然后对编组的量化系数进行Huffman编码。
根据MPEG标准,以使相邻变换值域沿时间轴重叠50%的方式对音频信号执行MDCT,以便抑制失真发生在相邻变换值域之间的边界部分上。另外,利用长变换值域(由长视窗定义的)或短变换值域(每一个都是由短视窗定义的)将音频信号映射到频率域中。长视窗包括2048个样值,而短视窗包括256个样值。从长视窗产生的MDCT系数的数目为1024,而从每一个短视窗产生的MDCT系数的数目为128。一般而言,对于信号波形变化细微的稳定部分,需要使用长视窗类型。对于信号波形变化剧烈的冲击部分,需要使用短视窗类型。使用其中哪一个是重要的。如果为瞬态信号使用长视窗类型,则称作预回波的噪声发生在冲击部分之前。当为稳定信号使用短视窗类型时,由于在频域中的分辩率缺乏、编码效率降低以及噪声出现,同样也不能执行适当的比特分配。这种缺陷对于低频声音是格外显著的。
根据MPEG标准所提出的方法,对于频谱数据帧的视窗类型的确定始于对时域音频数据执行快速傅里叶变换(FFT)以及计算FFT系数。然后使用FFT系数来计算所述帧内的每个比例因子带的音频信号强度。同样,利用音质建模来确定所述帧的可容许失真级别。可容许失真级别表示能在不可听到的情况下被注入到频谱数据中的最大噪声量。根据所述帧的可容许失真级别和该帧内的每个比例因子带的音频信号强度,计算知觉熵(perceptual entropy)。如果知觉熵大于预定常量,则为所述帧使用短视窗类型。否则,为所述帧使用长视窗类型。
进行视窗类型确定的上述方法要进行大量的计算。另外,如果信号强度高,则不论所述信号是瞬态的还是稳定的,所得到的知觉熵的数值都可能是高的。也就是说,即使所述帧不处于转变中,也可能给一帧指定短视窗类型。正如上面所论述的那样,这将导致编码效率降低以及噪声出现。
此外,如果判定使用短视窗类型,则产生MDCT系数的8个连续块(短视窗)。为了减少与短视窗相关联的辅助信息量,可以将短视窗编组。每个群组都包括一个或多个连续的短视窗,其比例因子是相同的。然而,当没有适当地执行编组时,出现代码数量的增加或音质的下降。当群组的数量相对于短视窗的数量而言过大时,原本可以被共同编码的比例因子将被重复编码,由此使编码效率降低。当群组的数量相对于短视窗的数量而言过小时,即使是当音频信号变化剧烈时也使用公共比例因子。其结果是,音质被降低。所述MPEG标准未提供任何用于编组短视窗的特定方法。
发明内容
利用长视窗类型来为数据的当前帧和数据的下一帧来计算初级修正离散余弦变换(MDCT)系数。然后,使用所计算出的当前帧和下一帧的初级MDCT系数来确定当前帧的视窗类型。如果所确定的视窗类型不是长视窗类型,则利用所确定的视窗类型来为当前帧计算最终MDCT系数。
附图说明
通过如下详细说明以及本发明各种实施例的附图,将更充分地理解本发明,然而不应该将这些理解为将本发明限制到特定的实施例,而是仅用来解释和帮助理解。
图1是编码系统的一个实施例的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼电子有限公司,未经索尼电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010268819.8/2.html,转载请声明来源钻瓜专利网。