[发明专利]可扩展的数字音频编码框架及其扩展方法无效

申请号：	200610165864.4	申请日：	2006-12-14
公开（公告）号：	CN101202042A	公开（公告）日：	2008-06-18
发明（设计）人：	陈睿	申请（专利权）人：	中兴通讯股份有限公司
主分类号：	G10L19/00	分类号：	G10L19/00;G10L19/14;G10L21/02;G10L11/02;H03M7/30;H04N7/24
代理公司：	北京安信方达知识产权代理有限公司	代理人：	许志勇;颜涛
地址：	518057广东省深圳市南山***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	扩展数字音频编码框架及其方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种音视频编码技术，具体说，涉及一种可扩展的数字音频编码框架及其扩展方法。

背景技术

AVS标准是“信息技术先进音视频编码”(Audio and Video codingStandard Workgroup of China)系列标准的简称，其核心是把数字视频和音频数据压缩为原来的几十分之一甚至百分之一以下，AVS包括系统、视频、音频等三个主要标准和一致性测试等支撑标准，这是基于我国创新技术和公开技术制定的开放标准，旨在为中国的音视频产业提供完整的信源编码技术方案。无论AVS标准还是其它标准，其物理实现都是一块解码芯片或者编码芯片。

在很多的通用数字音频编码框架中，只定义了单独的音频编码方法，不具备可扩展性，存在通用部分和扩展部分兼容性、统一性不够的问题，特别是在需要进行音频编码框架扩展时，例如从通用音频应用扩展到移动音频应用时，需要定义特定的数字音频编码框架。

发明内容

本发明所解决的技术问题是提供一种可扩展的数字音频编码框架，解决了通用部分和扩展部分兼容性和统一性不够的问题，使得语音和音乐得到较好的编码质量。

技术方案如下：

可扩展的数字音频编码框架包括：

核心编码器，接收PCM流，对所述PCM流中的音频信号或者语音信号进行单声道和编码，并发送；

带宽扩展模块，接收PCM流中的噪声信号，所述带宽扩展模块利用噪声信号中的低频分量来重建高频分量，将引导信息加载到编码后的码流中，发送到码流格式器；

立体声模块，接收PCM流中的立体声信号，从所述立体声信号中提取立体声参数，形成辅助的比特流，发送到码流格式器；

码流格式器，接收核心编码器、带宽扩展模块、立体声模块的信号，形成输出码流。

优选的，所述核心编码器包括：

语音非语音鉴别模块，接收PCM流，鉴别和区分PCM流中的语音信号、音频信号，并将语音信号或者音频信号选择发送；

通用音频编码器，接收所述音频信号，对所述音频信号进行编码并发送；

语音编码器，接收所述语音信号，对所述语音信号进行编码并发送；

第一开关元件，选择导通语音非语音鉴别模块和通用音频编码器，或者选择导通语音非语音鉴别模块和语音编码器；

第二开关元件，选择导通码流格式器和通用音频编码器，或者选择导通码流格式器和语音编码器。

优选的，立体声模块在编码时，立体声信号经左右声道混合得到的单声道信号。

本发明所解决的另一个技术问题是提供一种数字音频编码的扩展方法，使得语音和音乐得到较好的编码质量。

技术方案如下：

数字音频编码的扩展方法包括如下步骤：

(1)在带宽扩展模块中，利用接收到的PCM流中的噪声信号进行带宽扩展，并发送；

(2)在立体声模块中，利用接收到的PCM流中的立体声信号，从所述立体声信号中提取立体声参数，形成辅助的比特流，并发送；

(3)在核心编码器中，将接收到的PCM流中的音频信号或者语音信号进行编码，并发送；

(4)码流格式器接收带宽扩展模块、立体声模块、核心编码器的输入信号，进行组合编码形成输出流。

进一步，步骤(3)具体为：

(31)语音非语音鉴别模块接收PCM流，鉴别和区分PCM流中的语音信号、音频信号，并将语音信号或者音乐信号选择发送；

(32)当语音非语音鉴别模块发送音频信号时，第一开关元件选择导通语音非语音鉴别模块和通用音频编码器；当语音非语音鉴别模块发送语音信号时，第一开关元件选择导通语音非语音鉴别模块和语音编码器；

(33)通用音频编码器对接收到的音频信号进行编码，经第二开关元件发送到所述码流格式器；或者，语音编码器对接收到的语音信号进行编码，经第二开关元件发送到所述码流格式器。

本发明解决了通用部分和扩展部分兼容性和统一性不够的问题，，带宽扩展和立体声技术可以方便的与核心编码器融合，使得语音和音频得到较好的编码质量。同时，继承了通用音频的优点，使得码流的兼容性和统一性得到保证。

附图说明

图1是可扩展的数字音频编码框架的结构框图；

图2是通过复制产生高频的频率-能量曲线图；

图3是对高频部分进行包络调整的频率-能量曲线图；

图4是立体声信号的输入生产波形图。

具体实施方式

下面参照附图，对本发明的优选实施例作详细描述。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司，未经中兴通讯股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200610165864.4/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]可扩展的数字音频编码框架及其扩展方法无效

专利文献下载