[发明专利]使用宽带对准参数与多个窄带对准参数编码或解码多声道信号的设备及方法有效
申请号: | 201780018903.4 | 申请日: | 2017-01-20 |
公开(公告)号: | CN108780649B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 斯特凡·拜尔;埃伦妮·福托波罗;马库斯·缪特拉斯;吉约姆·福克斯;伊曼纽尔·拉维利;马库斯·施奈尔;斯蒂芬·多拉;沃尔夫冈·耶格斯;马丁·迪茨;格兰·马尔科维奇 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋融冰 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 宽带 对准 参数 窄带 编码 解码 多声道 信号 设备 方法 | ||
用于编码具有至少两个声道的多声道信号的设备,包含:参数确定器(100),用于从多声道信号确定宽带对准参数及多个窄带对准参数;信号对准器(200),用于使用宽带对准参数及多个窄带对准参数对准至少两个声道以获得已对准的声道;信号处理器(300),用于使用已对准的声道计算中间信号及侧边信号;信号编码器(400),用于编码中间信号以获得经编码的中间信号并用于编码侧边信号以获得经编码的侧边信号;及输出接口(500),用于生成经编码的多声道信号,经编码的多声道信号包含经编码的中间信号、经编码的侧边信号、宽带对准参数的信息、及多个窄带对准参数的信息。
技术领域
本申请涉及立体声处理,或大体涉及多声道处理,其中多声道信号具有在立体声信号的情况下的两个声道,如左声道及右声道,或具有多于两个声道,如三、四、五或任何其它数目的声道。
背景技术
相比于立体声音乐的存储及广播,立体声语音及特别是会话式立体声语音受到远较少的科学关注。实际上,在语音通信中,至今仍主要使用单声道传输。然而,随着网络带宽及容量的增加,预期基于立体声技术的通信将变得更普及且将带来更佳的收听体验。
为了高效存储或广播,在音乐的感知音频编码中已对立体声音频材料的高效编码进行长时间研究。在波形保留至关重要的高比特率下,已经长期采用称作中间/侧边(M/S)立体声的和-差立体声。对于低比特率,已经引入强度立体声及最近以来的参数立体声编码。在不同标准中采用最新技术,如HeAACv2及Mpeg USAC。其产生两声道信号的降混并关联紧凑空间边信息。
联合立体声编码通常建立在高频分辨率(即低时间分辨率,信号的时间-频率变换)上,且于是与在大部分语音编码器中执行的低延迟及时域处理不兼容。此外,产生的比特率通常为高。
另一方面,参数立体声采用位于编码器前端的额外滤波器组作为预处理器及位于解码器后端的额外滤波器组作为后处理器。因此,参数立体声可与如ACELP的常规语音编码器一起使用,如在MPEG USAC中进行的那样。此外,听觉场景的参数化可以最少量边信息达成,这适用于低比特率。但如同例如在MPEG USAC中,参数立体声并未被特别设计用于低延迟且不会针对不同会话式情境传递一致的质量。在空间场景的常规参数表示中,立体声影像的宽度被应用于两个合成声道上的解相关器人工复制并受由编码器计算及传输的声道间相干性(IC)参数的控制。对于大部分立体声语音,此种加宽立体声影像的方式不适于重新创建作为相当直接声音的语音的自然环境,原因在于相当直接声音是由位于空间内的特定位置的单个源产生(偶尔具有来自室内的一些混响)。相比之下,乐器具有比语音远更自然的宽度,其可通过将声道解相关而更佳地模拟。
当利用不重合麦克风纪录语音时也会出现问题,如在当麦克风彼此远离或用于双耳纪录或渲染时的A-B配置中。这些情境可被预期用于在电话会议中捕捉语音或用于在多点控制单元(MCU)中以遥远扬声器创建虚拟听觉场景。信号的到达时间从一个声道到另一个声道是不同的,不同于在重合麦克风上进行的纪录,例如X-Y(强度纪录)或M-S(中间-侧边纪录)。该未经时间对准的两个声道的相干性计算则可能被错误地估计,使得人工环境合成失败。
有关立体声处理的先前技术参考文献为专利号为5,434,948或8,811,621的美国专利。
文件WO 2006/089570 A1公开了近透明或透明的多声道编码器/解码器方案。多声道编码器/解码器方案额外产生波形类型残差信号。此残差信号连同一个或多个多声道参数一起被传输至解码器。与纯粹参数多声道解码器相反,加强式解码器由于额外残差信号而产生具有改进输出质量的多声道输出信号。在编码器侧,左声道及右声道两者均由分析滤波器组滤波。然后,对于每个子频带信号,针对子频带计算对准值及增益值。然后在进一步处理之前执行此种对准。在解码器侧,执行去对准及增益处理,然后对应信号被合成滤波器组合成,以便产生经解码的左信号及经解码的右信号。
已发现这些先前技术过程不能为音频信号及特别是在有多于一个扬声器情况下(即在会议情境或会话式语音场景中)语音信号提供优化。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780018903.4/2.html,转载请声明来源钻瓜专利网。