[发明专利]一种基于卷积神经网络的双耳声源定位方法有效
申请号: | 201811045818.X | 申请日: | 2018-09-07 |
公开(公告)号: | CN109164415B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 周琳;马康宇;陈俐源;林震宇 | 申请(专利权)人: | 东南大学 |
主分类号: | G01S5/22 | 分类号: | G01S5/22;G06N3/04 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
地址: | 211189 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于卷积神经网络的双耳声源定位方法,在子带内计算双耳声信号的互相关函数,组成二维数据作为特征参数,对卷积神经网络进行训练,得到卷积神经网络分类器;测试过程中计算测试双耳声信号的互相关函数作为二维特征参数,利用训练好的卷积神经网络分类器估计每帧双耳声信号对应的方位信息。在不同声学环境下的实验结果表明,本发明提出的基于卷积神经网络的双耳声源定位方法,具有很好的鲁棒性,尤其是在高噪声和强混响情况下显著提升了定位正确率,优于现有技术中的经典算法。 | ||
搜索关键词: | 一种 基于 卷积 神经网络 声源 定位 方法 | ||
【主权项】:
1.一种基于卷积神经网络的双耳声源定位方法,其特征在于,包括以下步骤:(1)将训练单声道声信号与不同方位角、不同混响时间的双耳房间脉冲响应函数进行卷积,并加入不同信噪比的白噪声,得到不同声学环境下不同方位角对应的训练双耳声信号;(2)对步骤(1)得到的训练双耳声信号进行子带滤波、分帧和加窗,得到各个子带分帧后的训练双耳声信号;(3)对于步骤(2)得到的各个子带分帧后的训练双耳声信号,计算每一帧双耳声信号的互相关函数CCF,从而得到训练双耳声信号各个子带对应的多帧CCF;(4)对于步骤(3)得到的各个子带对应的多帧CCF,将同一帧中不同子带的CCF函数组成一个矩阵,作为每一帧双耳声信号对应的二维特征参数;(5)对于步骤(4)得到的每一帧二维特征参数,将其作为卷积神经网络的输入层参数,将方位角作为卷积神经网络的输出参数,基于前向传播和反向传播算法训练卷积神经网络;(6)对不同方位角、不同声学环境下的测试双耳声信号进行子带滤波、分帧和加窗,得到各个子带分帧后的测试双耳声信号;(7)对于步骤(6)得到的各个子带分帧后的测试双耳声信号,计算每一帧双耳声信号的互相关函数CCF,从而得到测试双耳声信号各个子带对应的多帧CCF;(8)对于步骤(7)得到的各个子带对应的多帧CCF,将同一帧中不同子带的CCF函数组成一个矩阵,作为每一帧双耳声信号对应的二维特征参数;(9)将步骤(8)得到的每一帧二维特征参数作为步骤(5)训练后得到的卷积神经网络的输入特征,估计得到每一帧测试双耳声信号的方位角。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811045818.X/,转载请声明来源钻瓜专利网。