[发明专利]信息处理装置和方法以及程序在审
申请号: | 201980042350.5 | 申请日: | 2019-06-20 |
公开(公告)号: | CN112352278A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 畠中光行;知念徹;辻实;本间弘幸;山本优树 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴孟秋 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 方法 以及 程序 | ||
本技术涉及一种能够减少代码量的信息处理装置和方法以及程序。信息处理装置包括:获取单元,其获取关于父空间内的子空间的位置和大小的空间信息以及指示对象在子空间内的位置的子空间内位置信息,所述子空间包括在父空间中,并且所述对象包括在子空间中;以及计算单元,其基于空间信息和子空间内位置信息,计算指示对象在父空间内的位置的父空间内位置信息。本技术可以应用于信号处理装置。
技术领域
本技术涉及一种信息处理装置和方法以及一种程序,更具体地,涉及一种能够减少代码量的信息处理装置和方法以及程序。
背景技术
基于音频对象在作为原点的收听者位置周围空间移动的思想,为了固定视点,运动图像专家组(MPEG)-H编码标准使传统三维(3D)音频成为标准(例如,参见非专利文献1)。
另一方面,还提出了一种关于自由视点的技术,其中,收听者可以在空间中自由移动,即,收听者的视点位置(收听位置)可以自由移动。
引文列表
非专利文献
非专利文献1:ISO/IEC 23008-3信息技术-异构环境下的高效编码和媒体传输-第3部分:3D音频
发明内容
本发明要解决的问题
例如,在为了自由视点的音频再现中,在空间中存在的每个对象的位置被传输的情况下,包括在整个空间上的所有对象的位置信息被编码。即,包括在整个空间上的在坐标系中的所有对象的位置信息被编码。
然而,在整个空间中,对象的存在位置存在偏差,并且对象可能集中在空间中的特定区域。在这种情况下,当针对整个空间对对象的位置信息进行归一化和编码时,甚至需要用于表示对象实际上不存在的区域的信息量(代码量)。结果,传输的代码量增加。
针对这种情况而提出本技术,使得可以减少代码量。
问题的解决方案
根据本技术的一个方面的信息处理装置包括:获取单元,其获取有关父空间内的子空间的位置和大小的空间信息以及指示对象在子空间内的位置的子空间内位置信息,所述子空间包括在父空间中,并且所述对象包括在子空间中;以及计算单元,其基于空间信息和子空间内位置信息,计算指示对象在父空间内的位置的父空间内位置信息。
根据本技术的一个方面的信息处理方法或程序包括:获取有关父空间内的子空间的位置和大小的空间信息以及指示对象在子空间内的位置的子空间内位置信息,所述子空间包括在父空间中,并且所述对象包括在子空间中;并且基于空间信息和子空间内位置信息,计算指示对象在父空间内的位置的父空间内位置信息。
在本技术的一个方面中,获取有关父空间内包括的子空间的位置和大小的空间信息以及指示子空间中包括的对象在子空间内的位置的子空间内位置信息,并且基于空间信息和子空间内位置信息,计算指示对象在父空间内的位置的父空间内位置信息。
本发明的效果
根据本技术的一个方面,可以减少代码量。
注意,此处描述的效果不一定受到限制,并且可以是本公开中描述的任何效果。
附图说明
图1是描述父空间和子空间的示图;
图2是用于描述父空间和子空间的坐标系的示图;
图3是描述量化的示意图;
图4是示出划分索引和划分数量的示例的示图;
图5是示出子空间中位置信息的量化示例的示图;
图6是用于描述所使用的比特长度的差异的示图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980042350.5/2.html,转载请声明来源钻瓜专利网。