[发明专利]一种基于听觉匹配的虚拟声定制方法及装置有效

专利信息
申请号: 202010019433.7 申请日: 2020-01-08
公开(公告)号: CN111246363B 公开(公告)日: 2021-07-20
发明(设计)人: 宋昊;钟小丽;刘雪洁;王杰 申请(专利权)人: 华南理工大学
主分类号: H04S3/00 分类号: H04S3/00;H04S7/00;G06N3/04;G06N3/08
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 何淑珍;江裕强
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 听觉 匹配 虚拟 定制 方法 装置
【权利要求书】:

1.一种基于听觉匹配的虚拟声定制方法,其特征在于,包括如下步骤:

步骤1、获取用户头部的3D模型;

步骤2、从3D模型中提取HRTF相关的生理特征值;

步骤3、将生理特征值输入听觉评估神经网络,预测听觉分数;

步骤4、从已知HRTF数据库中挑选出最高听觉分数所对应的HRTF数据,作为用户听觉匹配的HRTF数据;

步骤5、将原始单通路信号、听觉匹配HRTF数据、房间脉冲响应依次进行时间域卷积处理或等价地频率域滤波处理,得到用户定制的双耳虚拟声信号;

步骤6、采用耳机播放双耳虚拟声信号。

2.根据权利要求1所述的一种基于听觉匹配的虚拟声定制方法,其特征在于:步骤1中的所述用户头部的3D模型能通过移动终端自带的3D传感装置直接获取,或通过移动终端拍摄的2D图像的3D重构间接获取。

3.根据权利要求1所述的一种基于听觉匹配的虚拟声定制方法,其特征在于:步骤2中HRTF相关的生理特征值包括:两耳屏间宽、耳甲腔高度、耳甲腔宽度、耳甲腔深度、耳前后偏转角、耳凸起角和斐波那契偏离度,其中,所述斐波那契偏离度的计算方式如下:

公式(1)中的34和55分别是斐波那契数列的第九项和第十项。

4.根据权利要求1所述的一种基于听觉匹配的虚拟声定制方法,其特征在于:步骤3中听觉评估神经网络的输入是用户的M个生理特征值,输出是用户对N类HRTF数据的听觉分数。

5.根据权利要求1所述的一种基于听觉匹配的虚拟声定制方法,其特征在于:步骤3中听觉评估神经网络已事先构造和训练完毕,步骤如下:

步骤601、选取一个已知的HRTF数据库,包括N名受试者的多个空间方向的HRTF数据,即N类HRTF数据;

步骤602、选取K个听音者,采用3D扫描的方式获取听音者头部的3D模型;利用软件从3D模型中提取HRTF相关的M个生理特征值,进行离差标准化,获得M×K的生理特征值矩阵P=[pm,k],其中,m=1, 2,…, Mk=1, 2,…, K

步骤603、采用N类HRTF数据制作虚拟声信号,用K个听音者进行虚拟声的听觉实验,得到N×K的听觉分数矩阵S=[sn,k],其中,n=1, 2,…, Nk=1, 2,…, K

(2)式中an,k表示第k个听音者对第n类HRTF虚拟声信号的头中率,bn,k表示第k个听音者对第n类HRTF虚拟声信号的前后混乱率,cn,k表示第k个听音者对第n类HRTF虚拟声信号的仰角定位准确率;

步骤604、构造一个广义回归神经网络,生理特征值作为网络输入,听觉分数作为网络输出,上述{ P=[pm,k],S=[sn,k]}构成训练集;采用留一法确定网络的平滑因子;

步骤605、保存训练好的神经网络模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010019433.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top