[发明专利]一种高效可配置的频域参数立体声及多声道编解码方法与系统有效

申请号：	200710099046.3	申请日：	2007-05-10
公开（公告）号：	CN101067931A	公开（公告）日：	2007-11-07
发明（设计）人：	王磊;李迅;刘颖;徐森	申请（专利权）人：	芯晟（北京）科技有限公司
主分类号：	G10L19/00	分类号：	G10L19/00;G10L19/02;G10L19/04
代理公司：	中科专利商标代理有限责任公司	代理人：	朱进桂
地址：	100083北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种高效配置参数立体声多声道解码方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于立体声及多声道编解码技术领域，具体地说是一种高效可配置的频域参数立体声及多声道编解码方法与系统。

背景技术

经过多年的技术发展，数字音频编码技术已经非常成熟。目前，很多音频编码技术已经成为工业标准被大量应用。如Dolby实验室的AC-3、MPEG组织的MP3和AAC以及3GPP组织的AMR-WB+和EAAC+等，这些技术是数字编码技术在不同阶段发展的结果。随着移动领域、互联网以及无线通讯领域的日益普及，对于更有效的编码技术仍有很大的需求。

减少编码比特率的编码策略主要原理是去除信号冗余以及感知不相关的成分。比如利用预测或变换方法可以有效的去除信号冗余；去除感知不相关是从感知意义上去除不影响感知质量的成分。而对于多声道信号可以利用声道间的冗余以进一步提高编码效率。

编码多声道信号的技术有多种。比如一种叫做“和差立体声编码(mid-side coding)”的技术，这种技术不是直接编码左右声道信号而是先将左右声道信号变换成和差声道信号再进行编码，这样如果左右声道相关性很强，则编码和差声道所用的比特数就可以少于单独编码左右声道所用的比特数。但是由于编码和声道和差声道都是采用所谓的“波形编码”技术，所用的比特数仍然较高，所以这项技术一般都用于较高编码比特率如mp3、AAC等编码器中。

另外有一种叫做强度立体声编码(intensity stereo coding)技术，该技术的原理是：对于高频段(大于2kHz)的信号，听觉的方向感与有关信号强度的变化(信号包络)有关，而与信号的波形无关，即恒包络信号对听觉方向感无影响，因此可利用这一特点以及多声道间的相关信息，将若干声道合成一个共同声道进行编码，这就形成了强度立体声技术。这种技术可以大大减少编码比特数，但是一些研究表明在高频段，相位信息对编码质量还是有一定影响的，所以这项技术的应用就受到了限制。

在AMR-WB+编码器中，采用了所谓的“参数立体声编码(parameter stereo coding)技术。该技术首先对差声道信号进行重采样处理以得到差声道信号的低频部分和高频部分。然后对低频部分和高频部分分别处理。其中对低频部分进行变换编码，而对高频部分则利用和声道的高频去估计差声道的高频，然后进行增益控制。可以说AMR-WB+的参数立体声结合了“波形编码”和“参数编码”两种技术，在编码比特数和编码质量之间进行了较好的平衡。但是由于AMR-WB+的参数立体声对低频部分和高频部分分别进行编码，所以其机构就受到了限制，比如当编码比特率变高时不能有效的改进高频部分的编码质量；而且由于在时域进行重采样，所以在低频部分和高频部分出现不同的延迟，从而使编码结构变得很复杂。

发明内容

为了克服现有技术中的不足，本发明的目的在于提供一种高效可配置的频域参数立体声及多声道编解码方法与系统，提供一致的编解码框架以解决由于在时域重采样而使编解码结构过于复杂的问题。

本发明的再一个目的在于提供一种高效可配置的频域参数立体声及多声道编解码方法与系统，其特点是对于采用精确编码的低频带宽可以根据编码比特率进行灵活控制，比如当可用的编码比特率较高时，可以扩大低频的范围，反之则降低低频的范围。同时保持编解码器框架的一致性。

本发明的第三个目的在于提供一种高效可配置的频域参数立体声及多声道编解码方法与系统，其特点是高频部分进行增益控制是在频域中进行的，所以提高了频率分辨率，使高频部分的质量得到了改善。

本发明的第四个目的在于提供一种高效可配置的频域参数立体声及多声道编解码方法与系统，其特点是根据信号特征，信号的时间分辨率和频率分辨率同时可调，从而采取最适合当前信号的信号处理方法，使信号质量得到了增强。

为完成上述发明目的，本发明提供一种高效可配置的频域参数立体声及多声道编码方法，该方法包括以下步骤：

1)将左右声道信号转换成和差声道信号；

2)将和声道信号用单声道音频编码器进行编码；

3)将和差声道信号进行预测分析，得到和差声道的残差信号及预测分析滤波器系数；本步骤在某些具体实施例中可省略，此时应视本步骤等效于直通，为便于统一阐述，仍称直通状态下的输出为和差声道的残差信号；

4)用和声道残差信号对差声道残差信号根据信号类型进行估计，得到估计的差声道残差信号，信号估计的时间单元根据信号类型确定，当稳态信号时采用长帧，当瞬态信号时则将长帧分成多个短的子帧进行；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于芯晟（北京）科技有限公司，未经芯晟（北京）科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200710099046.3/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种高效可配置的频域参数立体声及多声道编解码方法与系统有效

专利文献下载