[发明专利]基于对象的环绕声编码解码器的具有反馈的可缩放降混设计有效
申请号: | 201380038248.0 | 申请日: | 2013-07-19 |
公开(公告)号: | CN104471640B | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | 向佩;D·森;K·T·哈特曼 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;H04S7/00;G10L19/22;G10L19/24 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 宋献涛 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频对象 群集分析 空间信息 配置 音频流 元数据 分组 群集 音频信号处理 解码器 编码解码器 传输信道 所述空间 环绕声 可缩放 显现器 反馈 | ||
一股来说,本发明描述用于将音频对象分组成群集的技术。在一些实例中,一种用于音频信号处理的装置包含群集分析模块,所述群集分析模块经配置以基于N个音频对象中的每一者的空间信息将包含所述N个音频对象的多个音频对象分组成L个群集,其中L小于N,其中所述群集分析模块经配置以接收来自传输信道、解码器及显现器中的至少一者的信息,且其中L的最大值是基于所述所接收信息。所述装置还包括:降混模块,其经配置以将所述多个音频对象混合成L个音频流;及元数据降混模块,其经配置以基于所述空间信息及所述分组产生指示所述L个音频流中的每一者的空间信息的元数据。
本申请案主张以下各临时申请案的优先权:2012年7月20日申请的第61/673,869号美国临时申请案;2012年12月21日申请的第61/745,505号美国临时申请案;及2012年12月21日申请的第61/745,129号美国临时申请案。
技术领域
本发明涉及音频译码且,更具体来说,涉及空间音频译码。
背景技术
环绕声的演进现今已使得许多输出格式可用于娱乐。市场上的环绕声格式的范围包含风行的5.1家庭影院系统格式,所述格式就侵入起居室来说已为超过立体声最为成功的。此格式包含以下六个通道:左前(L)、右前(R)、中心或前方中心(C)、左后或左环绕(Ls)、右后或右环绕(Rs)及低频效果(LFE)。环绕声格式的其它实例包含由日本放送协会或日本广播协会(NHK,Nippon Hoso Kyokai或Japan Broadcasting Corporation)开发以供(例如)超高清晰度电视标准使用的正发展的7.1格式及未来的22.2格式。可能需要环绕声格式按二维(2D)及/或按三维(3D)编码音频。然而,这些2D及/或3D环绕声格式需要高位速率以适当地按2D及/或3D编码音频。
发明内容
一般来说,描述用于在按2D及/或3D编码音频时将音频对象分组成群集以可能地减少位速率要求的技术。
作为一个实例,一种音频信号处理方法包含基于N个音频对象中的每一者的空间信息,将包含所述N个音频对象的多个音频对象分组成L个群集,其中L小于N。所述方法还包含将所述多个音频对象混合成L个音频流。所述方法还包含基于所述空间信息及所述分组,产生指示所述L个音频流中的每一者的空间信息的元数据,其中L的最大值是基于从传输信道、解码器及显现器中的至少一者接收的信息。
作为另一实例,一种用于音频信号处理的设备包括用于从传输信道、解码器及显现器中的至少一者接收信息的装置。所述设备还包括用于基于N个音频对象中的每一者的空间信息将包含所述N个音频对象的多个音频对象分组成L个群集的装置,其中L小于N且其中L的最大值是基于所述所接收信息。所述设备还包括用于将所述多个音频对象混合成L个音频流的装置,及用于基于所述空间信息及所述分组产生指示所述L个音频流中的每一者的空间信息的元数据的装置。
作为另一实例,一种用于音频信号处理的装置包括群集分析模块,所述群集分析模块经配置以基于N个音频对象中的每一者的空间信息将包含所述N个音频对象的多个音频对象分组成L个群集,其中L小于N,其中所述群集分析模块经配置以从传输信道、解码器及显现器中的至少一者接收信息,且其中L的最大值是基于所述所接收信息。所述装置还包括:降混模块,其经配置以将所述多个音频对象混合成L个音频流;及元数据降混模块,其经配置以基于所述空间信息及所述分组,产生指示所述L个音频流中的每一者的空间信息的元数据。
作为另一实例,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述指令在被执行时致使一或多个处理器基于N个音频对象中的每一者的空间信息将包含所述N个音频对象的多个音频对象分组成L个群集,其中L小于N。所述指令还致使所述处理器将所述多个音频对象混合成L个音频流且,基于所述空间信息及所述分组,产生指示所述L个音频流中的每一者的空间信息的元数据,其中L的最大值是基于从传输信道、解码器及显现器中的至少一者接收的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380038248.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于定子的绕线方法、装置及模具
- 下一篇:线性致动器