[发明专利]一种基于深度学习的多声源测向方法及系统在审
申请号: | 201910661146.3 | 申请日: | 2019-07-22 |
公开(公告)号: | CN112257484A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 徐及;黄兆琼;颜永红 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08;G06F17/14 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;王宇杨 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 声源 测向 方法 系统 | ||
本发明涉及一种基于深度学习的多声源测向方法及系统,所述方法包括:将阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行做傅里叶变换,得到傅里叶变换后的信号;将傅里叶变换后的信号输入深度神经网络,使用反向传播方法训练深度神经网络,直至深度神经网络收敛;从收敛后的深度神经网络输出的后验概率中找到峰值对应的方位,该方位为声源出现的方位。本发明的方法利用了深度神经网络,通过优化准则函数,寻找声源波达方向的最优解,该方法直接从阵列接受的信号得到目标的方位,实现了简单而高效的多声源测向。
技术领域
本发明涉及声源测向技术领域,具体涉及一种基于深度学习的多声源测向方法及系统。
背景技术
声源测向技术可以指示声源目标所在的空间方位,为后续的信息采集与处理提供重要的空间信息。
传统方法主要利用现代数字信号处理的技术来估计声源的方位信息,通过格点匹配搜索或解析方式给出声源的波达方向,该方法的的计算复杂度较高。
近年来,深度神经网络被广泛应用于解决传统信号处理问题中,然而之前将深度学习应用于测向的研究大多数是基于浅层神经网络或者传统的神经网络。然而深度神经网络较浅层神经网络有更强大的寻找最优解的能力,将它用于寻找声源的波达方向的最优解有一定优势。
发明内容
本发明的目的在于克服上述实际环境下的多声源测向问题,提出了一种基于深度学习的多声源测向方法及系统,利用深度神经网络,实现鲁棒而高效的多声源测向。
为实现上述目的,本发明提出了一种基于深度学习的多声源测向方法,所述方法包括:
将阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行做傅里叶变换,得到傅里叶变换后的信号;
将傅里叶变换后的信号输入深度神经网络,使用反向传播方法训练深度神经网络,直至深度神经网络收敛;
从收敛后的深度神经网络输出的后验概率中找到峰值对应的方位,该方位为声源出现的方位。
作为上述方法的一种改进,所述将阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行做傅里叶变换,得到傅里叶变换后的信号;具体为:
所述阵列包括K个麦克风;将阵列接收的信号y(t)做傅里叶变换,将每个频率上的傅里叶变换系数的实部虚部串联向量X:
Y(fi)=fft(y(t)),
其中,Y(fi)为频率fi上的傅里叶变换系数;i为频率索引,F为傅里叶变换的点数;real(Y(fi))为Y(fi)的实部,imag(Y(fi))为Y(fi)的虚部;Y(fi)=[Y1(fi),Y2(fi),…,YL(fi)],L是快拍数。
作为上述方法的一种改进,所述将傅里叶变换后的信号输入深度神经网络,使用反向传播方法训练深度神经网络,直至深度神经网络收敛;具体为:
将向量X输入深度神经网络,所述深度神经网络的训练准则函数γ为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910661146.3/2.html,转载请声明来源钻瓜专利网。