[发明专利]音频编码和解码有效
申请号: | 200780006210.X | 申请日: | 2007-02-13 |
公开(公告)号: | CN101390443A | 公开(公告)日: | 2009-03-18 |
发明(设计)人: | D·J·布里巴尔特;E·G·P·舒伊杰斯;A·W·J·乌门 | 申请(专利权)人: | 皇家飞利浦电子股份有限公司 |
主分类号: | H04S3/00 | 分类号: | H04S3/00;H04S5/00 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 李静岚;刘 红 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 编码 解码 | ||
本发明涉及音频编码和/或解码,并且尤其是但并不是专门涉及双耳虚拟空间信号的音频编码和/或解码。
在最近十年来,对各种源信号的数字编码已变得越来越重要,这是因为数字信号表示和通信日益取代模拟表示和通信。例如,诸如视频和音乐之类的媒体内容的发行越来越基于数字内容编码。
此外,在最近十年中,已经有朝向多声道音频的趋势,并且具体地说,有朝向扩展超出了传统立体声信号的空间音频的趋势。例如,传统立体声录音仅包括两个声道,然而现代先进的音频系统典型地使用5个或6个声道(如在流行的5.1环绕声系统中)。这提供了用户被声源所环绕这样的更陷入其中的收听体验。
已为这种多声道信号的通信开发了各种技术和标准。例如,可以根据诸如高级音频编码(AAC)或者杜比数字标准这样的标准来传输表示5.1环绕系统的6个离散声道。
然而,为了提供向后兼容性,已为大家所熟知的是将较高数目的声道降混到较低数目并且具体地说它通常用于将5.1环绕声信号降混到立体声信号,以允许由传统(立体声)解码器对立体声信号进行重放并且由环绕声解码器对5.1信号进行重放。
一个示例是MPEG2向后兼容编码方法。将多声道信号降混到立体声信号。将附加信号编码到辅助数据部分中,这允许MPEG2多声道解码器产生多声道信号的表示。MPEG1解码器不予处理辅助数据并且因此仅对立体声降混进行解码。这个在MPEG2中应用的编码方法的主要缺点在于附加信号所需的附加数据率与对立体声信号进行编码所需的数据率具有相同的数量级。因此用于使立体声扩展到多声道音频的附加比特率是相当大的。
用于使多声道传输向后兼容而无需附加的多声道信息的其他现有方法典型地表征为矩阵环绕方法。矩阵环绕声编码的示例包括诸如杜比定向逻辑II(Dolby Prologic II)和逻辑-7(Logic-7)这样的方法。这些方法的普通原理是它们使输入信号的多声道与适当非二次矩阵矩阵相乘,从而产生具有较低声道数目的输出信号。具体地说,在使环绕声道与前置声道(front channel)和中心声道混合之前,矩阵编码器典型地将相移应用于环绕声道上。
声道转换的另一原因是编码效率。已发现例如可将环绕声音频信号编码成结合有用于对音频信号的空间特性进行描述的参数比特流的立体声声道音频信号。解码器可以非常满意的精度对立体声音频信号进行重放。按照这种方式,可获得显著的比特率节省。
存在用于对音频信号的空间特性进行描述的若干参数。一个这样的参数是诸如立体声信号的左声道与右声道之间的互相关性这样的声道间互相关性。另一参数是声道的功率比。在所谓的(参数)空间音频编码器中,从原始音频信号提取这些及其他参数以便生成下述音频信号,该音频信号具有例如仅单声道这样的数目降低的声道并加上用于对原始音频信号的空间特性进行描述的一组参数。在所谓的(参数)空间音频解码器中,恢复由所传送的空间参数所描述的空间特性。
这种空间音频编码优选地在编码器和解码器中采用包括标准单元的级连的或者基于树的分级结构。在编码器中,这些标准单元可以是诸如2至1、3至1、3至2等等降混器这样的、将声道组合成较低数目的声道的降混器,而在解码器中,相应标准单位可以是诸如1至2、2至3升混器这样的、将声道分成较高数目的声道的升混器。
3D声源定位是目前引发兴趣的,特别是在移动域中更是如此。当以3D定位时,移动游戏中的音乐重放和音响效果可向用户体验增添重要的价值,这有效地创建了‘头部之外’的立体效果。具体地说,已为大家所熟知的是对包含人耳敏感的特定方向信息的双耳音频信号进行录音和重放。典型地利用安装在假人头中的两个麦克风来进行双耳录音,因此所录的声音与人耳所捕获的声音相对应,并且包括由于头和耳的形状而引起的任何影响。双耳录音与立体声(也就是说立体音响)录音的不同之处在于,对双耳录音的重放通常是用于头戴式受话器或者头戴式耳机,然而立体声录音通常是为通过扩音器进行的重放而构造。虽然双耳录音允许仅利用两个声道来对所有空间信息进行重放,但是立体声录音不会提供相同的空间感知。通过利用一组感知传输函数来对每个规则信号进行卷积而将规则双声道(立体声)或者多声道(例如5.1)录音变换成双耳录音。这种感知传输函数对人耳以及可能的其它对象对信号的影响进行建模。众所周知类型的空间感知传输函数是所谓的与头相关的传输函数(HRTF)。还考虑到由于房间的墙壁、天花板和地板所引起的反射的替换类型的空间感知传输函数是双耳房间脉冲响应(BRIR)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司,未经皇家飞利浦电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780006210.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:彩色图像形成设备和颜色调整方法
- 下一篇:成像设备和图像处理方法