[发明专利]一种基于深度学习的多声源测向方法及系统在审

申请号：	201910661146.3	申请日：	2019-07-22
公开（公告）号：	CN112257484A	公开（公告）日：	2021-01-22
发明（设计）人：	徐及;黄兆琼;颜永红	申请（专利权）人：	中国科学院声学研究所
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/04;G06N3/08;G06F17/14
代理公司：	北京方安思达知识产权代理有限公司 11472	代理人：	陈琳琳;王宇杨
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习声源测向方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的多声源测向方法，所述方法包括：

将阵列接收的声源信号转换成数字声音信号；对所述数字声音信号进行做傅里叶变换，得到傅里叶变换后的信号；

将傅里叶变换后的信号输入深度神经网络，使用反向传播方法训练深度神经网络，直至深度神经网络收敛；

从收敛后的深度神经网络输出的后验概率中找到峰值对应的方位，该方位为声源出现的方位。

2.根据权利要求1所述的基于深度学习的多声源测向方法，其特征在于，所述将阵列接收的声源信号转换成数字声音信号；对所述数字声音信号进行做傅里叶变换，得到傅里叶变换后的信号；具体为：

将阵列接收的信号y(t)做傅里叶变换，将每个频率上的傅里叶变换系数的实部虚部串联向量X：

Y(f_i)＝fft(y(t))，

其中，所述阵列包括K个麦克风；Y(f_i)为频率f_i上的傅里叶变换系数；i为频率索引，F为傅里叶变换的点数；real(Y(f_i))为Y(f_i)的实部，imag(Y(f_i))为Y(f_i)的虚部；Y(f_i)＝[Y₁(f_i)，Y₂(f_i)，…，Y_L(f_i)]，L是快拍数。

3.根据权利要求2所述的基于深度学习的多声源测向方法，其特征在于，所述将傅里叶变换后的信号输入深度神经网络，使用反向传播方法训练深度神经网络，直至深度神经网络收敛；具体为：

将向量X输入深度神经网络，所述深度神经网络的训练准则函数γ为：

其中，Γ_f，p＝H(θ_p，f_i)[H^H(θ_p，f_i)H(θ_p，f_i)]H^H(θ_p，f_i)，定义导向矢量θ_p为第p个声源的波达方向，1≤p≤P；P为声源的个数；τ_k为第k个麦克风和第一个麦克风之间的时间延迟；1≤k≤K；Γ_f，pY_l(f_i)是一个K×1维的观察向量投影到导向矢量H(θ_p，f_i)的空间上；