[发明专利]信号处理装置、方法和程序在审
申请号: | 201880063759.0 | 申请日: | 2018-10-05 |
公开(公告)号: | CN111164673A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 本间弘幸;辻实;知念徹 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10K15/12 | 分类号: | G10K15/12;G10L19/00;G10L19/008;H04S5/02;H04S7/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴孟秋 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信号 处理 装置 方法 程序 | ||
本技术涉及能够提高编码效率的信号处理装置、方法和程序。信号处理装置包含:获取单元,用于获取混响信息和音频对象的音频对象信号,其中该混响信息包括音频对象周围的空间中固有的空间混响信息和音频对象中固有的对象混响信息中的至少一个;以及混响处理单元,用于基于混响信息和音频对象信号产生音频对象的混响分量的信号。本技术适用于信号处理装置。
技术领域
本技术涉及信号处理装置、方法和程序,更具体地,涉及能够提高编码效率的信号处理装置、方法和程序。
背景技术
传统上,已经在电影、游戏等中使用了对象音频技术,并且已经开发了能够处理对象音频的编码方法。具体地,例如,已知作为国际标准的MPEG(运动图像专家组)-H部分3:3D音频标准等(例如,参见非专利文献1)。
在这种编码方法中,类似于传统方法中的双声道立体声音方法和诸如5.1声道的多声道立体声音方法,运动声音源等被视为独立的音频对象,并且对象的位置信息可以与音频对象的信号数据一起被编码为元数据。
利用这种布置,可以在具有不同数量扬声音器的各种观看/收听环境中执行再现。此外,可以容易地在再现期间对特定声音源的声音执行处理,诸如调整特定声音源的声音的音量以及对特定声音源的声音添加效果,这在传统编码方法中是困难的。
例如,在非专利文献1的标准中,将称为基于三维矢量的振幅平移(VBAP)(以下简称为VBAP)的方法用于渲染处理。
这是通常称为摇摄的再现方法之一,并且是通过将增益分配给在同样以观看/收听位置作为原点存在于球面上的扬声音器之中最接近存在于球面上的音频对象的三个扬声音器来执行再现的方法。
通过摇摄的音频对象的这种渲染基于这样的前提,即所有音频对象都在以观看/收听位置作为原点的球面上。因此,在音频对象接近观看/收听位置或远离观看/收听位置的情况下的距离感测仅由音频对象的增益大小控制。
然而,实际上,如果不考虑取决于频率分量的不同衰减率、存在音频对象的空间中的反射等,则距离感的表达远离实际体验。
为了在收听体验中反映这样的效果,首先可以想到物理地计算空间中的反射和衰减以获得最终的输出音频信号。然而,尽管这种方法对于能够以非常长的计算时间产生的运动图像内容(诸如电影)是有效的,但是在实时再现音频对象的情况下使用这种方法是困难的。
此外,在通过物理计算空间中的反射和衰减而获得的最终输出中,难以反映内容创建者的意图。特别是对于诸如音乐剪辑的音乐作品,需要容易反映内容创建者意图的格式,诸如将优选的混响处理应用于声音轨等。
引证列表
非专利文献
非专利文献1:国际标准ISO/IEC23008-3第一版2015-10-15信息技术-异构环境中的高效编码和媒体递送-第3部分:3D音频
发明内容
本发明要解决的问题
因此,在实时再现中,期望将考虑到每个音频对象在空间中的反射和衰减的混响处理所需的系数等的数据以及音频对象的位置信息存储在文件或发送流中,并通过使用它们获得最终的输出音频信号。
然而,对于每个帧,在文件或发送流中存储每个音频对象所需的混响处理数据会增加发送速率,并且需要具有高编码效率的数据发送。
鉴于这种情况而做出本技术,并且本技术旨在提高编码效率。
解决问题的方法
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880063759.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:配线基板和配线基板的制造方法
- 下一篇:车辆用显示装置