[发明专利]一种基于头相关脉冲响应的三维音频生成装置有效
申请号: | 201710551437.8 | 申请日: | 2017-07-07 |
公开(公告)号: | CN107820158B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 陈喆;殷福亮;张古强 | 申请(专利权)人: | 大连理工大学 |
主分类号: | H04R3/00 | 分类号: | H04R3/00 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 阎昱辰;李洪福 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 相关 脉冲响应 三维 音频 生成 装置 | ||
本发明公开了一种基于头相关脉冲响应的三维音频生成方法,包括如下步骤:获得被测的人体生理特征参数,与头相关脉冲响应HRIR进行相关性分析;保留相关性超过阈值系数的人体生理特征参数;通过在数据库中寻找具有最小偏差之和的个体,得到当前被测人体的个性化HRIR,然后采用拉普拉斯特征映射降维(LEM)算法对HRIR进行插值;采用基于镜像模型ImageModel的前期反射混响器,对接收到的,包括在房间中的一次反射和二次反射的前期反射路径的输入音频与所述的HRIR进行卷积,恢复音频的方位信息;采用基于反馈延时网络FeedbackDelayNetwork,FDN的后期混响器得到混响音频;将所述的音频方位信息和混响音频相加,得到具有混响效果的三维音频,完成三维音频生成方法。
技术领域
本发明涉及一种基于头相关脉冲响应的三维音频生成装置,涉及专利分类号H04电通信技术H04R扬声器、传声器、唱机拾音器或其他声—机电传感器;助听器;扩音系统H04R5/00立体声装置。
背景技术
三维音频系统可以重建三维声场,恢复声源方位信息,产生具有方位感的声音,在人机交互系统、移动终端、视频会议系统、数字娱乐以及虚拟现实等系统中具有广泛应用。三维音频技术主要有波场合成技术、Ambisonics技术、幅度平移技术以及头相关脉冲响应技术。头相关脉冲响应(Head-RelatedImpulseResponse,HRIR)技术将单声道声源与人体左右耳处的头相关脉冲响应分别进行卷积处理,然后通过耳机进行重放,生成特定方位的虚拟声源,以实现三维声场重建。对HRIR进行傅里叶变换,可以到头相关传递函数(Head-RelatedTransferFunction,HRTF)。通常,用通用的头相关脉冲响应重构三维音频时,会产生空间定位误差、前后混淆和“颅中定位“等问题,而个性化的头相关脉冲响应尽管重构的三维音频效果好,但其测量过程复杂,数据量和计算量过大,从而限制了HRIR技术的应用。为此,本发明提出了一种HRIR个性化方法,用以改善空间定位误差和前后混淆问题,并通过人工混响技术,解决“颅中定位”问题,同时提出一种HRIR插值算法,提高了HRIR数据的空间分辨率,使三维音频系统具有更好的听觉效果。
现有技术中存在基于参数匹配的头相关传递函数个性化方法。该方法从数据库中选取35个具有测量参数的个体,将其中5个做为测量对象,另外30个做为基准对象;对于每个测量对象,从基准对象集中寻找与其HRIR最接近的基准对象,计算测量对象与基准对象间参数的偏差,并将偏差最小的4个参数作为所选参数;然后,测量个体的这4个参数,并从数据库中寻找与被测个体这4
然而该方法只用到了人体耳廓参数,虽然可以有效地估计高度角,但由于缺乏头颅和肩膀的相关参数,其水平角定位精度不佳。此外,在参数选取过程中,没有考虑参数之间相互作用对HRIR的影响。该方法使用的两个角度参数,在实际应用中难以测量。
现有技术中还存在一种基于局部线性嵌入(LocallyLinearEmbedding,LLE)的空间听觉重建方法,实现HRTF数据库的压缩和插值。该方法基于流形思想,首先用局部线性嵌入算法对HRTF数据进行降维处理,然后在低维空间提取HRTF数据的特性,对数据进行聚类分析,选取特征HRTF,而非特征HRTF则通过其邻近的特征HRTF加权插值得到。该方法只需保留HRTF数据库中的特征HRTF,因此较好地压缩了HRTF数据。实验结果表明,该方法的HRTF重构效果优于主成分分析方法。
该方案虽然考虑到了HRTF之间的相关性,但没有充分利用HRTF数据自身的特点,只考虑同一个体HRTF间的相关性,忽略了相同个体不同耳朵间HRTF的相关性以及不同个体间HRTF的相关性,因此其插值性能有限。此外,该方法不能用已有方位的HRTF来求得未知方位的HRTF,因此其HRTF数据的空间分辨率无法高于现有方法。
在现有技术中也有基于反馈延时网络的尝试,该方案利用反馈延时来模拟声波的多次反射,通过合理的延时参数、衰减参数以及反馈通路个数,可以获得较满意的混响效果。实验结果表明,通过12个延时通道与合适的反馈矩阵,可以实现较好的混响效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710551437.8/2.html,转载请声明来源钻瓜专利网。