[发明专利]一种音频编码解码方法及其装置有效
申请号: | 200910058339.6 | 申请日: | 2009-02-16 |
公开(公告)号: | CN101527139A | 公开(公告)日: | 2009-09-09 |
发明(设计)人: | 阮思恩;司国鹏 | 申请(专利权)人: | 成都九洲电子信息系统有限责任公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 北京市路盛律师事务所 | 代理人: | 温利平 |
地址: | 610041四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 编码 解码 方法 及其 装置 | ||
技术领域
本发明涉及一种音频编码解码的技术领域,尤其涉及一种可以抑制音频信号预回声的编码解码方法及其装置。
背景技术
现今的音频编码已进入了感知编码(perceptual coding)的时代,得到广泛运用的代表是MP3(MPEG-1 Layer III)和AAC(先进音频编码)。音频的感知编码,不仅采用传统的变换编码(将时间信号转换为频率信号再进行编码)以去除音频信号的时间统计冗余,而且使用心理声学模型计算感知域上允许的量化噪声以进一步去除那些与人听觉无关的信号部分。
一个标准的音频感知编码器是一个因果的编码器:即,一个声音文件被分段为若干交迭的时间块(帧),这些时间帧被变换为频域系数并量化。每一帧都是依次处理的,过去的n-1,n-2……会影响到第n帧的编码结果。解码器为了从频域系数重建原信号,反向变换时必须使用交迭相加(overlap add)的方式:即,交迭区域的反向量化样点必须通过相加来得到最终的时间信号。最主流应用的交迭变换(lapped transform)是MDCT(改进型离散余弦变换),它将2M个时间采样点变换为M个频域系数。MDCT变换是基于50%的交迭程度,每次变换更新M个样点并交迭M个样点。
预回声失真是感知编码系统中的一种音频假象(artefact)。当原始音频信号中存在暂态部分,即在低能量区域后出现能量突变区域,同时该能量突变区域正好位于编码块的后部,这时编码结果中将出现预回声失真。在基于交迭变换的音频编码系统中(如MP3和AAC),量化和比特分配是为了满足通过完整变换窗(transform window)下所有频率谱线计算而得到的量化噪声掩频阀值(masking thresholds);这种情况下,量化误差将会作为一种完整窗长度的误差信号而叠加在变换窗的频率谱线之上,量化产生的噪声也将遍布在整个变换 窗内。同时,在解码端为实现信号完美重建(perfect reconstruction)而必须使用交迭相加方式,这意味着量化噪声除了遍布在本窗内,还将在交迭相加的过程中被叠加到前一帧中。这将导致在解码的音频信号中,真实的暂态声音将出现(扩散)在突变之前的低能量区域,即预回声失真。在对富含有敲击乐器的音频信号进行编码时,预回声失真的发生尤为常见,影响了编码的质量。
预回声失真的产生,究其原因主要有两个部分。一是在当前帧内未能有效的捕捉突变信号,二是当前帧的突变信号由于交迭相加而对前一帧产生回溯影响。对于预回声失真产生的第一个原因,现在的音频编码技术普遍使用窗切换(window switching)来捕捉信号的时变性,并辅以时域噪声整型(temporalnoise shaping)对突变部分的包络进行编码。对于预回声失真产生的第二个原因,现有的解决方法是在编码端放弃掉交迭变换,即帧与帧之间不再交迭,但这种方式有如下问题:1、现在最广泛使用的基于50%交迭的变换将不再适用(比如MDCT);2、在无交迭的情况下,由编码理论的完美重建条件约束,唯一能够使用的时间窗将是矩形窗,但矩形窗的旁瓣抑制能力相当低,会带来严重的能量泄漏;3、无交迭(0%交迭)将带来块效应(blocking effect)音频失真,即在帧边界处由于量化误差而产生的人耳可闻的滴答声。
发明内容
本发明的目的是提供一种音频编码方法及其装置,有效的抑制预回声失真。
本发明还提供了一种与上述音频编码方法及其装置对应的音频解码方法及其装置,有效的抑制预回声失真。
本发明提供的音频编码方法的技术方案包括步骤:
(A)将输入的串行采样点的音频暂态信号分成并行采样点的音频帧,每帧包含M个采样点;
(B)将相邻输入帧的采样点相互交迭(L-M)/2个采样点,构成交迭的音频帧,该交迭帧依次包含上一音频帧末尾交迭的(L-M)/2个采样点、该音频帧的M个采样点、下一音频帧开始交迭的(L-M)/2个采样点,形成的该交迭帧共L个采样点,其中L为M到2M之间的任意自然偶数,同时将交迭程度参数(L-M)/2送到码流传输;
(C)对该交迭帧的L个采样点进行时域前向跨帧滤波处理,得到L个滤波采样点;
(D)将滤波后的L个采样点,通过抽取得到该帧对应的M个滤波采样点;
(E)将M个滤波后的时域采样点,通过非交迭的时间频率变换得到M个频域样点;
(F)对该帧的M个频域样点,乘以对应的乘性符号1或-1,得到符号反转处理后的M个频域样点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都九洲电子信息系统有限责任公司,未经成都九洲电子信息系统有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910058339.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于视频平衡传输的多功能电缆
- 下一篇:改善水波纹现象的液晶显示器及方法