[发明专利]语音音频混合分级编码中核心层残差提取系统及方法有效

申请号：	201010606009.9	申请日：	2010-12-27
公开（公告）号：	CN102074242A	公开（公告）日：	2011-05-25
发明（设计）人：	胡瑞敏;杨玉红;高丽;杨裕才;曾琦;陈先念;王国英	申请（专利权）人：	武汉大学
主分类号：	G10L19/14	分类号：	G10L19/14;G10L19/02
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	张火春
地址：	430072 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及音频编码技术领域，尤其涉及一种语音音频混合分级编码中核心层残差提取系统及方法。本发明提供的系统包括预处理模块（1）、语音编码模块（2）、音频编码模块（3）、模式选取模块（4）、语音解码合成模块（5）、音频解码合成模块（6）、残差生成模块（7）；本发明提供的用于获得语音音频混合编码模式下分级核心层与原始信号的准确残差的方法是本发明的主要内容，编码端的语音/音频编码器生成的合成信号用于进行最优编码模式的选择，利用语音/音频编码器输出的编码参数得到与解码端一致的合成信号，从而得到准确的残差用于分级增强层。本发明克服了现有语音音频混合编码模式下可分级核心层残差信号无法准确提取的问题。
搜索关键词：	语音音频混合分级编码核心层残差提取系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种语音音频混合分级编码框架中核心层残差提取系统，其特征在于，包括：预处理模块(1)：来自音频输入设备的单声道或多声道的输入信号(8)进行预处理，得到当前帧的音频信号(9)，并将所获得的当前帧的音频信号(9)做三路输出：一路输出给语音编码模块(2)，一路输出给音频编码模块(3)，一路输出给残差生成模块(7)；语音编码模块(2)：采用通用的语音编码算法对输入的当前帧的音频信号(9)进行编码，编码后作两路输出，其中一路输出为语音解码合成码流(10)，用于模式判决，另一路输出为编码提取的各类编码参数(15)，传递给语音解码合成模块(5)；音频编码模块(3)：采用通用的音频编码算法对输入的当前帧的音频信号(9)进行编码，编码后作两路输出，其中一路输出为音频解码合成码流(11)，用于模式判决，另一路输出为编码提取的各类编码参数(16)，传递给音频解码合成模块(6)；模式选取模块(4)：选取最优的编码模式，得到模式位标识(12)分两路输出，一路进入语音解码合成模块(5)，一路进入音频解码合成模块(6)；语音解码合成模块(5)：如果模式选取模块的输出(12)是语音编码模式，则进入语音解码合成模块(5)，利用语音编码模块输出的各类编码参数(15)作为输入，输出最终的核心层语音解码合成信号(13)；音频解码合成模块(6)：如果模式选取模块的输出(12)是音频编码模式，则进入音频解码合成模块(6)，利用音频编码模块输出的各类编码参数(16)作为输入，输出最终的核心层音频解码合成信号(14)；残差生成模块(7)：预处理模块输出的预处理后的当前帧的音频信号(9)和语音/音频解码合成模块输出的解码后合成信号为本模块的两路输入，根据模式位不同，选择语音解码合成信号(13)或音频解码合成信号(14)，计算得到残差信号(17)，本模块的输出为残差信号(17)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉大学，未经武汉大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201010606009.9/，转载请声明来源钻瓜专利网。

上一篇：软硬件结合解码的通用多媒体播放设备及其播放方法
下一篇：轨道列车驾驶仿真器操纵评价系统及其评价方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音音频混合分级编码中核心层残差提取系统及方法有效

专利文献下载