[发明专利]可分级的语音和乐音联合编码装置和解码装置无效

申请号：	200810037827.4	申请日：	2008-05-22
公开（公告）号：	CN101281749A	公开（公告）日：	2008-10-08
发明（设计）人：	刘佩林;刘彬彬;王瑾;孔吉;司马婷婷	申请（专利权）人：	上海交通大学
主分类号：	G10L19/10	分类号：	G10L19/10
代理公司：	上海交达专利事务所	代理人：	王锡麟;王桂忠
地址：	200240***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	分级语音乐音联合编码装置解码
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种数字音频编码技术领域的装置，具体是一种可分级的语音和乐音联合编码装置和解码装置。

背景技术

数字通信业务和数字存储业务的高速增长对数字信号处理技术提出了越来越高的要求。由于多媒体业务的不断扩展，不但需要更高的编码效率和实时性，对语音和乐音信号的普遍适应性的需求也越来越大。同时，在移动音频应用中，由于信道的不稳定性，需要依据信道情况自适应的调整码率，这就要求音频编解码器能够满足自适应多码率性，从而移动音频的可分级编码技术也成为下一代音频数字信号处理需要解决的关键技术。在通常的音频编码中，使用时域和频域混合编码的方式来解决针对语音和乐音信号不同特性进行编码的问题。

经对现有技术文献检索发现，第三代合作伙伴计划(The 3rd GenerationPartnership Project，3GPP)组织推荐的AMR-WB+(Adaptive MultiRate WideBandplus，自适应多速率宽带)音频编解码标准和国际电信联盟[InternationalTelecommunication Union，ITU-T]推荐的G.729.1音频编解码标准，这两种标准是主要的能够满足低码率、低复杂度、可分级的语音和乐音联合编码技术。

AMR-WB+是通过采取ACELP(代数码激励线性预测)和TCX(变换域激励编码)两种核心编码器来满足对语音和乐音信号的普遍适应性的，是一种通过对低码率的音频编码扩展而形成的一种混合编码方式。G.729.1采用可分级编码方式，包含了12个嵌入式层，每层均对应不同的码率与不同的编码技术，主要核心编码技术有CELP(码激励线性预测)、TDBE(时域频带扩展技术)和TDAC(时域混叠抵消预测变换编码技术)三种。G.729.1由于分层复杂，计算复杂度也相应增大。此外，由于AMR-WB+与G.729.1都是针对低码率音频编码的，AMR-WB+适应的码率范围为：单声道6～36kbps，立体声8～48kbps，G.729.1适应的码率范围为8～32kbps。当码率高到一定程度时，比如当码率达到64kbps时，这两种编码方案的效果就明显不如同码率下的AAC(Advance Audio Coding，高级音频编)了。这两种编码方式的优点在高码率下便体现不出来了。为此，有必要提出一种既适应于低码率又能随着码率的提高仍然保持高音质的编码方案。

此外，在AMR-WB+中提出的ACELP与TCX混合编码技术，将每帧信号分别用ACELP和TCX两种编码方式编码，分别在本地解码后，选取信噪比较高的编码方式编码，编码复杂度高，且由于每帧信号最终只用了一种编码方法编码，在编码过程中损失了不少信息量。

发明内容

本发明针对上述现有技术的不足，提出了一种可分级的语音和乐音联合编码装置和解码装置，使其利用语音和乐音检测技术、类语音信号编码技术、类乐音信号编码技术、残差编码技术等在保证高音质和低计算复杂度的前提下，提高对语音信号和乐音信号的普遍适应性，同时满足对码率的自适应性。

本发明是通过以下技术方案实现的：

本发明涉及一种可分级的语音和乐音联合编码装置，包括：语音和乐音分类单元、类语音编码单元、本地类语音解码单元、类乐音编码单元、本地类乐音解码单元、残差获取单元、打包输出单元，其中：

语音和乐音分类单元对输入的音频信号进行分类，根据分类结果将音频信号输入类语音编码单元或类乐音编码单元；

类语音编码单元负责对语音信号进行编码，获得编码参数，并输出至本地类语音解码单元、残差获取单元和打包输出单元；

本地类语音解码单元将类语音编码单元编码得到的参数进行本地解码，得到本地重构信号，并输出解码数据至残差获取单元；

类乐音编码单元负责对乐音信号进行编码，获得编码参数，并输出至本地类乐音解码单元、残差获取单元和打包输出单元；

本地类乐音解码单元将类乐音编码单元编码得到的参数进行本地解码，得到本地重构信号，并输出解码数据至残差获取单元；

残差获取单元取得输入音频信号与本地重构信号的残差，若本帧信号被判断为类语音信号，则将残差输入到类乐音编码单元；若本帧信号被判断为类乐音信号，则将残差输入到类语音编码单元；

打包输出单元将类语音编码单元和类乐音编码单元编码得到的参数打包输出。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海交通大学，未经上海交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810037827.4/2.html，转载请声明来源钻瓜专利网。

上一篇：电源系统、电子设备及为负载供电的方法
下一篇：图像处理设备、图像处理方法、程序以及记录介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]可分级的语音和乐音联合编码装置和解码装置无效

专利文献下载