[发明专利]使用深度扩展DirAC技术或其他技术生成经增强的声场描述或经修改的声场描述的概念在审
申请号: | 201880060085.9 | 申请日: | 2018-07-13 |
公开(公告)号: | CN111108555A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 于尔根·赫勒;伊曼纽尔·哈毕兹;阿克塞尔·普林格;奥利弗·蒂尔加特;法比安·库赤 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;H04S7/00;G06F3/01;G10L21/0272 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋融冰 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 深度 扩展 dirac 技术 其他 生成 增强 声场 描述 修改 概念 | ||
1.一种用于生成经增强的声场描述的装置,包括:
声场生成器(100),用于生成至少一个声场描述,所述至少一个声场描述指示关于至少一个参考位置的声场;以及
元数据生成器(110),用于生成与所述声场的空间信息相关的元数据;
其中,所述至少一个声场描述和所述元数据构成所述经增强的声场描述。
2.如权利要求1所述的装置,
其中所述声场生成器(100)被配置为生成具有不同时间-频率区间的一个或多个降混信号和各自方向数据以及可选的扩散数据的声场的DirAC描述;以及
其中所述元数据生成器(110)被配置为生成不同时间-频率区间的附加的各自位置或深度信息作为所述元数据。
3.如权利要求2所述的装置,
其中所述声场生成器(100)被配置为从所述声场生成器(100)所使用的音频信号或从与所述音频信号相关联的视频信号或从立体(三维)成像/视频或光场技术中所使用的深度图或从计算机图形场景的几何信息估计所述深度信息。
4.如前述权利要求中一项所述的装置,
其中所述元数据生成器(110)被配置为生成包括对于不同方向数据信息(322)的对应距离信息(324)的深度图(320)作为与空间信息相关的数据,所述不同方向数据信息(322)指示不同方向。
5.如前述权利要求中一项所述的装置,还包括:
输出界面(120),用于生成输出信号用于传输或存储,所述输出信号包括对于时间帧(302,304,306)的从所述声场以及时间帧(302,304,306)的空间信息(310,320)得出的一个或多个音频信号。
6.如前述权利要求中一项所述的装置,
其中所述声场生成器被配置为从所述声场得出方向数据(314),所述方向数据是指针对时间段或频率区间的声音的到达方向,以及,其中所述元数据生成器(110)被配置为得出空间信息作为将距离信息与所述方向数据相关联的数据项(324)。
7.如权利要求6所述的装置,
其中所述声场生成器被配置为针对所述声场描述的每个时间帧的不同频率区间得出所述方向数据(322),
其中所述元数据生成器被配置为针对所述时间帧得出将距离信息与所述方向数据相关联的所述数据项(324),以及
其中输出界面(120)被配置为生成输出信号,使得所述时间帧的数据项(324)被链接至所述不同频率区间的方向数据。
8.如前述权利要求中一项所述的装置,
其中所述空间信息为包括多个到达方向数据项(322)和多个关联距离(324)的深度图(320),使得所述多个到达方向数据项中的每个到达方向具有关联距离。
9.如前述权利要求中一项所述的装置,
其中所述声场生成器被配置为针对所述声场的时间帧的多个频率区间生成扩散信息(316),以及
其中所述元数据生成器(110)被配置为仅当频率区间的扩散值低于扩散阈值时针对所述频率区间生成距离信息,或其中所述元数据生成器(110)被配置为仅当频率区间的扩散值低于阈值扩散值时生成与预定值不同的距离元数据。
10.一种用于从声场描述和与声场描述的空间信息相关的元数据生成经修改的声场描述的装置,包括:
声场计算器(420),用于使用所述空间信息、所述声场描述以及指示从参考位置到不同参考位置的平移的平移信息,计算经修改的声场。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880060085.9/1.html,转载请声明来源钻瓜专利网。