[发明专利]信息处理装置、信息处理方法和程序在审
申请号: | 201880019499.7 | 申请日: | 2018-03-15 |
公开(公告)号: | CN110447071A | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 知念彻;辻实;山本优树 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;H04S7/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;马骁 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频对象 收听位置 信息处理装置 信息处理 发送 整合 音频数据 数据量 合成 应用 | ||
本技术涉及一种能够减少在发送多个音频对象的数据时要发送的数据量的信息处理装置、信息处理方法以及程序。根据本发明的一个方面的信息处理装置,针对多个假定收听位置中的预定的假定收听位置,将多个音频对象中具有在预定的假定收听位置处无法区分的声音的音频对象进行整合;并且,将由该合成的整合音频对象的数据,以及具有在预定的假定收听位置能够区分的声音的其它音频对象的数据一起发送。本技术可以应用于可以处理基于对象的音频数据的装置。
技术领域
本技术涉及一种信息处理装置、一种信息处理方法以及一种程序,特别是涉及能够减少在传输多个音频对象的数据时要发送的数据量的一种信息处理装置、一种信息处理方法以及一种程序。
背景技术
随着视频技术的成就,自由视点视频技术引起关注。存在着一种技术:将来自多个方向的多个摄像机捕获的图像进行组合,从而将目标对象保持为点云的运动图像,并根据观看目标对象的方向或距离观看目标对象的距离生成视频(NPL 1)。
一旦实现从自由视点观看视频,人们就开始还具有对声音的需求,要求听取声音,使他们感觉好像他们在视点的位置处。鉴于此,近年来,基于对象的音频技术正在引起关注。基于对象的音频数据通过基于每个音频对象的波形数据的元数据呈现为根据再现侧的系统的期望数量的通道的信号来被再现。
[引文列表]
[非专利文献]
[NPL 1]
筑波大学的网站,“HOMETSUKUBAFUTURE-#042:Customizing Sports Events withFree-Viewpoint Video”,[检索日期:2017年3月22日],<URL:http://www.tsukuba.ac.jp/notes/042/index.html>
发明内容
[技术问题]
在基于对象的音频数据的传输中,要发送的音频对象的数量越大,数据发送量越大。
本技术就是鉴于这种情况而制定的,其目标是使在发送多个音频对象的数据时能够减少要发送的数据量。
[解决问题的方法]
根据本技术的一个方面的信息处理装置包括:组合单元,其针对多个假定收听位置中的预定的假定收听位置,将多个音频对象中具有在预定的假定收听位置处无法区分的声音的音频对象进行组合;发送单元,发送单元,其将通过组合获得的组合音频对象的数据以及具有能够在预定的假定收听位置区分的声音的其它音频对象的数据一起发送。
基于作为组合目标的多个音频对象的音频波形数据和渲染参数,可以使组合单元生成组合音频对象的音频波形数据和渲染参数。
可以使发送单元将由组合单元生成的音频波形数据和渲染参数作为组合音频对象的数据发送,并将其它音频对象中的每个的音频波形数据和用于预定的假定收听位置的渲染参数作为其它音频对象的数据发送。
可以使组合单元将各位置处的多个音频对象组合,各位置与预定的假定收听位置相距等于或长于预定距离的距离。
可以使组合单元将以预定的假定收听位置为基准时窄于预定角度的水平角度的范围内的多个音频对象进行组合。
可以使组合单元将具有在预定的假定收听位置处无法区分并且属于同一预设组的声音的音频对象进行组合。
可以使组合单元执行音频对象组合,使得要发送的音频对象的数量成为与传输比特率对应的数量。
可以使发送单元发送包括标志信息的音频比特流,该标志信息表示音频比特流中包括的音频对象是未组合音频对象还是组合音频对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880019499.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于接近度的语音启用特征
- 下一篇:声道间带宽扩展