[发明专利]一种基于卷积神经网络的室内麦克风阵列声源定位方法在审
申请号: | 201910254676.6 | 申请日: | 2019-03-31 |
公开(公告)号: | CN110068795A | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 张涛;焦琛 | 申请(专利权)人: | 天津大学 |
主分类号: | G01S5/20 | 分类号: | G01S5/20;G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 混响 室内麦克风 脉冲响应 声源定位 阵列声源 室内 加权 矩阵 仿真模型建立 互相关函数 麦克风阵列 应用和发展 传播模型 仿真模型 模拟房间 其他机器 三维定位 声源信号 室内环境 室内声音 方向角 俯仰角 鲁棒性 特征集 分类 噪声 学习 | ||
1.一种基于卷积神经网络的室内麦克风阵列声源定位方法,其特征在于,包括如下步骤:
1)建立体现室内脉冲响应的混响仿真模型,根据混响仿真模型建立室内声源信号传播模型;
2)提取声音信号矩阵X的特征,即加权广义互相关函数;
3)卷积神经网络训练所提取的特征。
2.根据权利要求1所述的一种基于卷积神经网络的室内麦克风阵列声源定位方法,其特征在于,步骤1)是使用Roomsim仿真工具模拟室内脉冲响应建立混响仿真模型如下:
式中,Dim表示室内尺寸,vc表示室内的声速,SNR表示信噪比,Slocation表示声源信号位置,Mi,location表示第i个麦克风的位置,表示平均吸声系数,T60表示混响时间,混响时间T60与平均吸声系数的关系用艾润公式描述:
式中,S表示室内墙壁总面积,V表示室内体积。
根据混响仿真模型建立室内声源信号传播模型如下:
X=H*s(t)+N (2)
式中,X=[x1,x2,x3,…xi…xM,]表示室内麦克风阵列接收到的声音信号矩阵,其中xi为第i个麦克风接收到的信号,H=[h1,h2,h3,...hi...hM,]表示室内脉冲响应,hi为声源到达第i个麦克风的室内脉冲响应,N=[w1,w2,w3,...wi...wM,]表示室内噪声,wi为第i个麦克风接收到的噪声,M表示麦克风阵列中阵元个数,s(t)表示声源信号。
3.根据权利要求1所述的一种基于卷积神经网络的室内麦克风阵列声源定位方法,其特征在于,步骤2)包括:
(1)计算t时刻第i个和第j个麦克风接收到的信号xi(t)和xj(t)的傅里叶变换Xi(ω)和Xj(ω);
(2)计算互功率谱
(3)对互功率谱进行傅里叶反变换,求广义互相关函数Ri,j(τ):
(4)对广义互相关函数Ri,j(τ)进行加权:
4.根据权利要求1所述的一种基于卷积神经网络的室内麦克风阵列声源定位方法,其特征在于,步骤3)将提取的特征输入到卷积神经网络的输入层,依次经过卷积层、激励层、池化层、全连接层,最后经输出层输出,其中,
卷积层用于对输入图像不同局部的矩阵和卷积核矩阵进行卷积运算,提取图像特征;激励层用于对卷积层的输出结果做非线性映射,激励函数选择ReLU,它的特点是收敛快,求梯度简单;池化层用于对映射后的特征进行压缩;全连接层为单层结构,神经元个数为1024,最后在输出层,使用Softmax函数,将输出转化成室内声源位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910254676.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种AOA定位优化补偿方法
- 下一篇:一种用于声源定位的麦克风阵列方法