[发明专利]一种量化噪声泄漏控制方法及装置有效
申请号: | 200810056312.9 | 申请日: | 2008-01-16 |
公开(公告)号: | CN101488344A | 公开(公告)日: | 2009-07-22 |
发明(设计)人: | 张德明;张琦 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G06F17/14 |
代理公司: | 北京凯特来知识产权代理有限公司 | 代理人: | 郑立明 |
地址: | 518129广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 量化 噪声 泄漏 控制 方法 装置 | ||
技术领域
本发明涉及通信技术领域,尤其涉及一种量化噪声泄漏控制方法及装置。
背景技术
在音频以及宽带、超宽带语音编解码中,以MDCT(Modified DiscreteCosine Transform,修正的离散余弦变换)等为基础的变换域编码具有很好的能量压缩及频率分辨性能,因此得到了广泛运用。其核心思想是将一定长度的信号通过某种变换变换到变换域,然后根据特定的量化策略对变换域的系数进行量化编码。由于人耳听觉中存在着掩蔽效应,因此考虑量化策略的时候可以利用这一特性,当信号能量较大时允许有较大的量化误差。
对于音频或语音信号来说,经常存在这样的场景:信号从相对很小的能量突然过渡到很大的能量,这会导致基于MDCT等的变换编解码器出现预回声(pre-echo)效应,即后一较大能量的帧的量化误差在解码端通过MDCT的重叠相加泄露到了前面能量相对较小的帧中。如图1a所示为未编码的信号示意图;图1b为变换编码后的信号示意图。一般这种Pre-Echo超过2毫秒的人耳前掩蔽时间就会被人耳察觉。相应的也会有Post-Echo(后回声)效应,然而Post-Echo一般会被长达几十毫秒的人耳后掩蔽效应掩盖。所以在语音音频编解码中通常需要关注的是Pre-Echo效应。
现有技术一解决上述技术问题的技术方案为:窗长切换技术
窗长切换技术是基于MDCT变换的算法解决由预回声引起的量化噪声泄漏的典型算法,在MPEG、PAC、ATARC(Adaptive Transform AcousticCoding,自适应音频变换编码)中都采用了这种技术。在信号比较平稳的时 候采用较长的分析窗,在信号突然出现瞬态信号的时候采用较短的分析窗。针对不同的信号特性采用不同的分析窗长主要有两个优点:首先,对瞬态信号采用较短的分析窗可以减小量化噪声在时域上的泄漏,同时也可以由这个瞬态信号产生的掩蔽效应使得泄漏的噪声对听觉不产生影响;其次采用较短的分析窗可以将瞬态信号所需的较多的比特数限制在最短的时间范围内。本方案中判断是否产生瞬态信号主要通过计算感知熵(PE)这一参数进行判断。
在实现本发明过程中,发明人发现现有技术一至少存在如下缺点:
由于采用了长度不同的分析窗,所以编码器中的感知模型和无损编码部分都需要支持多种时间分辨率;其次在采用较短的分析窗时,频域分辨率会很低,编码效率降低;而且分析窗的切换本身就会给编码器带来更多的时延。感知熵的计算过程非常复杂,而且存在着较多的误判,会导致错误的窗切换。
与本发明相关的现有技术二的技术方案为:时域噪声整形技术
如果某个信号在时域是一个脉冲,那么它在频域则是一个可预测的周期性信号,可以在频域通过LPC(Linear Prediction Coding,线形预测编码)来得到较大的编码增益。TNS(Temporal Noise Shaping,时域噪声整形)就是基于这一想法在频域对每一帧输入信号的频谱进行LPC分析,当LPC的预测增益大于一定门限的时候,即认为出现了瞬态信号,然后对LPC分析之后的残差信号进行基于感知编码原则的编码,将LPC分析得到合成滤波器系数作为边信号进行传输;否则就认为没有检测到瞬态信号,按照正常状态编码。
在实现本发明过程中,发明人发现现有技术二至少存在如下缺点:
利用TNS进行瞬态信号检测的准确率较低,会出现很多误判,由此会导致整个编码效率的降低。
综上所述,现有技术解决预回声引起的量化噪声在时域泄漏问题的方法存在如下诸多问题:计算复杂度高、时延较大、编码效率不高、占用系统资源较多、准确率低等。
发明内容
本发明实施例提供一种量化噪声泄漏控制方法及装置,具有低时延、低复杂度、高效准确等特性。
本发明实施例是通过以下技术方案实现的:
本发明实施例提供一种编码装置,用于对音频信号编码,包括:瞬态信号检测单元及选择控制单元;
所述瞬态信号检测单元,用于对当前输入的一帧信号进行瞬态分析,检测是否出现瞬态信号,并发送瞬态信号检测结果;所述瞬态信号检测单元进一步包括:
最大幅值计算子单元,用于将一帧信号分为多个子帧,计算每个子帧的最大幅度值;
瞬态检测函数计算子单元,计算每个子帧的最大幅度值与该子帧相邻前几个子帧的最大幅度值之和的比值,得到瞬态检测函数;
检测子单元,用于判断所述比值是否大于一定阈值,如果比值大于一定的阈值,则认为检测到了瞬态信号,否则就认为没有检测到瞬态信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810056312.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:BCH码控制器接口电路
- 下一篇:一种宽带语音编码器及方法