[发明专利]混合模式空间声生成系统与方法有效
申请号: | 201610268371.7 | 申请日: | 2016-04-27 |
公开(公告)号: | CN105959905B | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 孙学京;张晨 | 申请(专利权)人: | 北京时代拓灵科技有限公司 |
主分类号: | H04S7/00 | 分类号: | H04S7/00;G10L19/008 |
代理公司: | 北京创遇知识产权代理有限公司11577 | 代理人: | 武媛,吕学文 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混合 模式 空间 生成 系统 方法 | ||
1.一种混合模式空间声生成系统,其特征在于,所述混合模式空间声生成系统包括渲染控制模块、ambisonic编码器、双耳转码器和耳机与头部跟踪装置,所述渲染控制模块分别与ambisonic编码器和双耳转码器连接,所述ambisonic编码器与双耳转码器连接,所述耳机与头部跟踪装置分别与ambisonic编码器和双耳转码器连接;所述渲染控制模块用于接收一路或多路音频对象,检测音频对象的个数,当音频对象的个数大于第一阈值A时,激活ambisonic编码器构成的ambisonic域分支,采用ambisonic方法处理音频对象,得到虚拟环绕空间声并传输到ambisonic编码器,由ambisonic编码器输出虚拟环绕空间声的双耳输出虚拟环绕声信号;否则激活双耳转码器构成的单独对象渲染分支,使用单独对象渲染方法处理音频对象,得到虚拟环绕空间声并输出虚拟环绕空间声的双耳输出虚拟环绕声信号;所述渲染控制模块还进一步用于检测音频对象的元数据,所述元数据包括时间和对应的音频对象在三维空间的位置,还包括发散度;所述渲染控制模块根据音频对象的发散度决定该音频对象的处理方式,如果音频对象的发散度大于第二阈值B,则将该音频对象暂时分配到ambisonic域分支;暂时分配结束后,根据音频对象处理设备的当前状况,计算运算复杂度,根据运算复杂度确定是否重新分配音频对象;运算复杂度通过统计音频对象处理设备的运算周期得出。
2.如权利要求1所述混合模式空间声生成系统,其特征在于,1个ambisonic域分支相当于T个单独音频分支的复杂度;当运算复杂度允许N个音频对象的时候,如果当前音频对象有M个,单独对象渲染分支能够处理0至N-T个音频对象,ambisonic域分支能够处理M-N+T个音频对象,如果分配给单独对象渲染分支的音频对象的个数H小于N-T个,则将ambisonic域分支中的1至N-T-H个音频对象中的任意多个音频对象重新分配给单独对象渲染分支;所述N大于T,M大于0,H大于或等于0;如果N小于T,则全部使用单独对象渲染分支;如果N等于T,则根据音频对象发散度,全部使用ambisonic域分支,或全部使用单独对象渲染分支。
3.如权利要求1所述混合模式空间声生成系统,其特征在于,所述渲染控制模块根据音频对象的发散度确定音频对象的分配;如果音频对象的发散度高于X,则在满足复杂度的情况下,把音频对象分配到ambisonic域分支,反之,把音频对象分配到单独对象渲染分支;其中X由用户指定。
4.一种混合模式空间声生成方法,其特征在于,所述混合模式空间声生成方法包括以下步骤:
输入一路或多路音频对象;
检测音频对象的个数,当音频对象的个数大于第一阈值A时,激活ambisonic域分支,采用ambisonic方法处理音频对象,得到虚拟环绕空间声;否则激活单独对象渲染分支,使用单独对象渲染方法处理音频对象,得到虚拟环绕空间声;
暂时分配结束后,根据音频对象处理设备的当前状况,计算运算复杂度,根据运算复杂度确定是否重新分配音频对象;运算复杂度通过统计音频对象处理设备的运算周期得出;当运算复杂度允许N个音频对象的时候,如果当前音频对象有M个,单独对象渲染分支能够处理0至N-T个音频对象,ambisonic域分支能够处理M-N+T个音频对象,如果分配给单独对象渲染分支的音频对象的个数H小于N-T个,则将ambisonic域分支中的1至N-T-H个音频对象中的任意多个音频对象重新分配给单独对象渲染分支;所述N大于T,M大于0,H大于或等于0;如果N小于T,则全部使用单独对象渲染分支;如果N等于T,则根据音频对象发散度,全部使用ambisonic域分支,或全部使用单独对象渲染分支;
所述混合模式空间声生成方法进一步包括检测音频对象的元数据,所述元数据包括时间和对应的音频对象在三维空间的位置,还包括音频对象发散度;
所述混合模式空间声生成方法进一步包括根据音频对象的发散度决定该音频对象的处理方式,如果音频对象的发散度大于第二阈值B,则将该音频对象暂时分配到ambisonic域分支。
5.如权利要求4所述混合模式空间声生成方法,其特征在于,根据音源的发散度确定音频对象的分配,如果音源的发散度高于X,则在满足复杂度情况下,把音频对象分配到ambisonic分支,反之,把音频对象分配到单独音源渲染分支;其中X由用户指定。
6.如权利要求4或5所述混合模式空间声生成方法,其特征在于,所述混合模式空间声生成方法采用静态模式或者动态模式检测音频对象的个数和检测音频对象的元数据;所述静态模式是指仅在最开始检测一次音频对象的个数和音频对象的元数据;所述动态模式是指随着时间的推移,动态地调整如何将音频对象分配到单独对象渲染分支和ambisonic域分支这两路分支;所述动态模式的具体做法是采用固定时间间隔采样或非固定时间采样;所述固定时间间隔采样是指每间隔固定的时间段;检测一次音频对象的个数和音频对象的元数据;所述非固定时间采样是指基于音频对象的起始时间,在每个新的音频对象开始和结束的时刻检测一次音频对象的个数和音频对象的元数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京时代拓灵科技有限公司,未经北京时代拓灵科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610268371.7/1.html,转载请声明来源钻瓜专利网。