[发明专利]针对子带编码音频的三维声场合成方法无效

申请号：	200710036278.4	申请日：	2007-01-09
公开（公告）号：	CN101221763A	公开（公告）日：	2008-07-16
发明（设计）人：	欧阳合;王阳;周毅;王新成;黄娟;徐晖;顾群楠	申请（专利权）人：	上海杰得微电子有限公司
主分类号：	G10L19/00	分类号：	G10L19/00;G10L19/02;H03M7/30
代理公司：	上海浦一知识产权代理有限公司	代理人：	丁纪铁
地址：	201203上海市浦东新区张***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	针对编码音频三维声场合成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种基于分带处理的双工三维声场合成方法，特别是涉及一种基于各种子带编码(如mp3、AC3、AAC等)音频的三维声场合成方法。

背景技术

人在聆听声音时，不仅能够听到声音的内容、强弱，还可以听到声音的方向。各种录音和回放技术可以很方便地记录原始声音的内容和强弱等信息，但方向信息却往往无法保留。利用各种声学和听觉心理学的原理，来重现原始声音的方向信息的录音回放技术，被称为三维声场合成(或三维虚拟声源、三维声场重建等)。

双工(duplex)理论是三维声场合成所依据的重要理论之一。听觉心理学研究发现，改变两耳听到声音的强度差别(即双耳强度差，InterauralIntensity Difference IID)，人将感觉到声源的方向随之移动；改变两耳听到声音的先后(即双耳时间差，Interaural Time Difference ITD)也有相似的效果。结合这两种效应，人为改变回放声音的ITD和IID，即可虚拟三维声源，这就是双工理论。基于这种理论的三维虚拟方法如图1所示，它的特点是实现简单，应用广泛，既可用于耳机回放也可用于扬声器回放。但由于全频带ITD和IID对声源方位信息的描述较为粗略，所以这种方法还原的声音逼真度较低，声像较为模糊。最近的研究表明，在模拟某确定方位的声源时，如果分频带(以下简称分带)处理，对不同频带取不同ITD和IID值，将会取得更逼真的模拟效果。分带双工合成的处理流程如图2所示，它是直接处理目标音频的时域信号，当频带划分较细时可以达到很好的模拟效果；但美中不足的是，这种方法需要对声音信号进行额外的分带滤波和合成，使得附加的计算工作量很大。

发明内容

本发明要解决的技术问题是提供一种针对子带编码音频的三维声场合成方法，它能降低计算工作量、实现高度逼真，而且可以同时适用于耳机回放和扬声器回放。

为解决上述技术问题，本发明的针对子带编码音频的三维声场合成方法是采用如下技术方案实现的，以所述的音频格式规定的标准解码流程为基础将音频数据流解码；其中：在标准解码流程的综合滤波器组之前插入ITD/IID调整单元，该ITD/IID调整单元的输入信号为经过所述的标准解码流程解码后得到的子带信号，输出信号为经过ITD/IID调整单元调整的与输入信号格式相同的子带信号并将该输出信号送回标准解码流程中的综合滤波器组处理。

本发明基于听觉心理学的研究，对目标音频(或称目标音源、待处理音频等，即待处理的原始音频)进行分带处理，对不同频率的子带加入不同的ITD和IID，更精细地模拟了人耳对方位的感知信息，从而更逼真地模拟了三维声场。本发明针对基于子带编码的数字音频格式处理，直接调整音频解码过程中所恢复的各子带数据的ITD和IID，从而免去了一般分带双工合成处理方法所需的分带滤波和合成而产生的附加计算工作量，大大降低了分带双工合成的计算复杂度。

本发明适用于各种设备的三维声场合成，待处理音频既可以是单声道，也可以是双声道或多声道；回放路数可以是双路，也可以是多路；回放设备既可以是耳机，也可以是扬声器。回放设备、回放路数不同时，只需相应调整各子带的ITD和IID参数即可。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明：

图1是现有的基于双工理论的三维声场合成方法控制流程图；

图2是现有的基于分带双工理论的三维声场合成方法控制流程图；

图3是图2中的ITD/IID调整单元实施例一结构图；

图4是图2中的ITD/IID调整单元实施例二结构图；

图5是现有的基于子带编码的音频格式的解码流程示意图；

图6是本发明的针对子带编码音频的三维声场合成方法流程示意图；

图7是MPEG-1 Audio Layer-3的解码流程图；

图8是本发明将ITD/IID调整单元嵌入MPEG-1 Layer-3解码过程的三维声场合成方法流程图。

具体实施方式

下面以双声道耳机作为回放设备说明本发明的具体实现方法，但是应强调的是本发明并不局限于耳机的应用。

如图2所示，在基于分带双工理论的三维声场合成过程中，待处理音频经分带滤波器组滤波，输出n个不同频带范围的子带信号。左右声道中频率相同的子带信号输入其对应的ITD/IID调整单元(分带双工调整单元)，调整彼此的ITD和IID。调整后的子带信号按照声道分别归组，输入到各自声道的综合滤波器组，合成为最终播放的时域信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海杰得微电子有限公司，未经上海杰得微电子有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200710036278.4/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]针对子带编码音频的三维声场合成方法无效

专利文献下载