[发明专利]用以利用平均值而基于下混信号表示形态和与下混信号表示形态相关联的参数侧边信息来提供用于提供上混信号表示形态的一或多个经调整参数的装置、方法与计算机程序有效
申请号: | 201080052486.3 | 申请日: | 2010-10-15 |
公开(公告)号: | CN102714035A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | 科尔内利娅·法尔克;于尔根·赫莱;莱昂·特伦迪 | 申请(专利权)人: | 弗兰霍菲尔运输应用研究公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚;吴孟秋 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用以 利用 平均值 基于 信号 表示 形态 相关 参数 侧边 信息 提供 用于 多个经 调整 装置 | ||
技术领域
依据本发明的实施例涉及一种用以基于一下混信号表示形态及与该下混信号表示形态相关联的一参数侧边信息来提供用于提供一上混信号表示形态的一或多个经调整参数的装置。
依据本发明的另一实施例涉及一种用以基于该下混信号表示形态及该参数侧边信息来提供一上混信号表示形态的装置。
依据本发明的另一实施例涉及一种用以基于一下混信号表示形态及与该下混信号表示形态相关联的一参数侧边信息来提供用于提供一上混信号表示形态的一或多个经调整参数的方法。
依据本发明的另一实施例涉及一种用以执行该方法的计算机程序。
依据本发明的若干实施例涉及一种用于MPEG SAOC的失真控制参数限制方案。
背景技术
于音频处理、音频传输及音频储存领域,逐渐需要处理多声道内容来改良听觉感受。多声道音频内容的使用给使用者带来显著改进。举例言的,可获得三维空间听觉感受而为使用者带来娱乐效果的满足与改善。但多声道音频内容也可用于职业环境,例如用于电话会议应用,原因在于通过使用多声道音频回放可改良发话者的可懂性(易于为人所了解)。
但也期望在音频质量与位率需求间获得良好折衷,来避免因多声道应用造成额外过度资源负荷。
近来,已经提示用于含有多音频对象的音频场景(audio scene)进行位率有效的传输及/或储存的参数技术,例如双耳线索编码(类别I)(例如参考参考文献[1])、联合来源编码(例如参考参考文献[2])、及MPEG空间音频对象编码(例如参考参考文献[3]、[4]、[5])。
若执行极端对象的呈现(rendering),则组合在接收端的使用者互动,此等技术可导致输出信号的低音频质量(例如参考参考文献[6])。
此等技术针对听觉上重建期望的输出音频场景而非通过波形匹配。
图8显示此种系统(此处:MPEG SAOC)的系统概述。图8所示MPEG SAOC系统800包含一SAOC编码器810及一SAOC解码器820。SAOC编码器810接收多个对象信号x1至xN,其例如可表示为时域信号或时频域信号(例如呈傅立叶型变换的一变换系数集合形式,或呈QMF子频带信号形式)。SAOC编码器810典型地也接收下混系数d1至dN,其与对象信号x1至xN相关联。下混系数的分开集合可供下混信号的各声道利用。SAOC编码器810典型地被配置为经由依据相关联的下混系数d1至dN而组合对象信号x1至xN来获得一下混信号声道。典型地,下混声道比对象信号x1至xN少。为了允许(至少近似)于SAOC解码器820端的对象信号的分离(或分开处理),SAOC编码器810提供该一或多个下混信号(标示为下混声道)812及一侧边信息814二者。侧边信息814描述的对象信号x1至xN特性来允许解码器端的对象专一性处理。
SAOC解码器820被配置为接收该一或多个下混信号812及侧边信息814。又,SAOC解码器820典型地被配置为接收一使用者互动信息及/或一使用者控制信息822,其描述期望的呈现设定值。举例言之,使用者互动信息/使用者控制信息822可描述一扬声器设定值及提供对象信号x1至xN的该等对象的期望空间配置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗兰霍菲尔运输应用研究公司,未经弗兰霍菲尔运输应用研究公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080052486.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种仿生态的植物生长补光LED光源
- 下一篇:三相变四相平衡变压器