[发明专利]空间声渲染方法、装置和电子设备在审

申请号：	202011382988.4	申请日：	2020-12-01
公开（公告）号：	CN112616110A	公开（公告）日：	2021-04-06
发明（设计）人：	徐涛;董强国;孙学京;周令非;刘知一;张辉	申请（专利权）人：	中国电影科学技术研究所
主分类号：	H04R5/02	分类号：	H04R5/02;H04S7/00
代理公司：	北京知呱呱知识产权代理有限公司 11577	代理人：	杜立军
地址：	100086 北京***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	空间渲染方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种空间声渲染方法，其特征在于，包括：

获取给定的用于定义扬声器阵列解码渲染质量的至少两个客观指标，根据所述至少两个客观指标生成目标函数；

根据扬声器的数量和位置得到至少两个解码系数；

根据所述至少两个解码系数计算所述目标函数的值，通过非线性优化得到权重系数；

根据所述至少两个解码系数和权重系数得到最终加权解码系数；

根据所述扬声器的数量和位置构造特征向量，并以所述最终加权解码系数作为目标向量训练深度学习模型，通过所述深度学习模型预测所述至少两种解码系数的权重；

根据所述至少两种解码系数的权重进行空间声渲染。

2.根据权利要求1所述的空间声渲染方法，其特征在于，所述至少两个客观指标包括以下指标中的至少两个指标：

速度局部化矢量和声源方向的均方根误差；

能量局部化矢量和声源方向的均方根误差；

速度局部化矢量长度和1的均方根误差；

能量局部化矢量长度和1的均方根误差；

扬声器整体的重新生成的声压和能量增益的标准差。

3.根据权利要求1所述的空间声渲染方法，其特征在于，所述至少两个解码系数包括ALLRAD沉浸式音频渲染方法得到的解码系数和EPAD沉浸式音频渲染方法得到的解码系数。

4.根据权利要求3所述的空间声渲染方法，其特征在于，所述最终加权解码系数为所述ALLRAD沉浸式音频渲染方法得到的解码系数和所述EPAD沉浸式音频渲染方法得到的解码系数的加权求和。

5.一种空间声渲染装置，其特征在于，包括：

获取模块，用于获取给定的用于定义扬声器阵列解码渲染质量的至少两个客观指标，根据所述至少两个客观指标生成目标函数；

控制处理模块，用于根据扬声器的数量和位置得到至少两个解码系数，并根据所述至少两个解码系数计算所述目标函数的值，通过非线性优化得到权重系数，进而根据所述至少两个解码系数和权重系数得到最终加权解码系数；所述控制处理模块还用于根据所述扬声器的数量和位置构造特征向量，并以所述最终加权解码系数作为目标向量训练深度学习模型，通过所述深度学习模型预测所述至少两种解码系数的权重；

渲染模块，用于根据所述至少两种解码系数的权重进行空间声渲染。

6.根据权利要求5所述的空间声渲染装置，其特征在于，至少两个客观指标包括以下指标中的至少两个指标：

速度局部化矢量和声源方向的均方根误差；

能量局部化矢量和声源方向的均方根误差；

速度局部化矢量长度和1的均方根误差；

能量局部化矢量长度和1的均方根误差；

扬声器整体的重新生成的声压和能量增益的标准差。

7.根据权利要求5所述的空间声渲染装置，其特征在于，所述至少两个解码系数包括ALLRAD沉浸式音频渲染方法得到的解码系数和EPAD沉浸式音频渲染方法得到的解码系数。

8.根据权利要求7所述的空间声渲染装置，其特征在于，所述最终加权解码系数为所述ALLRAD沉浸式音频渲染方法得到的解码系数和所述EPAD沉浸式音频渲染方法得到的解码系数的加权求和。

9.一种电子设备，其特征在于，所述电子设备包括：至少一个处理器和至少一个存储器；

所述存储器用于存储一个或多个程序指令；

所述处理器，用于运行一个或多个程序指令，用以执行如权利要求1-4任一项所述的空间声渲染方法。