[发明专利]一种基于卷积神经网络的室内麦克风阵列声源定位方法在审
申请号: | 201910254676.6 | 申请日: | 2019-03-31 |
公开(公告)号: | CN110068795A | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 张涛;焦琛 | 申请(专利权)人: | 天津大学 |
主分类号: | G01S5/20 | 分类号: | G01S5/20;G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 混响 室内麦克风 脉冲响应 声源定位 阵列声源 室内 加权 矩阵 仿真模型建立 互相关函数 麦克风阵列 应用和发展 传播模型 仿真模型 模拟房间 其他机器 三维定位 声源信号 室内环境 室内声音 方向角 俯仰角 鲁棒性 特征集 分类 噪声 学习 | ||
一种基于卷积神经网络的室内麦克风阵列声源定位方法,包括如:建立体现室内脉冲响应的混响仿真模型,根据混响仿真模型建立室内声源信号传播模型;提取声音信号矩阵X的特征,即加权广义互相关函数;卷积神经网络训练所提取的特征。本发明使用麦克风阵列接收室内声音信号,利用其相位加权广义互相关合成训练特征集,使用RoomSim模拟房间脉冲响应(room impulse response,RIR),相比于其他机器学习或深度学习的声源定位方法,在噪声和混响恶劣的室内环境下有更高的定位分类精度和更强的鲁棒性,并且可以实现距离、方向角、俯仰角三维定位,具有更高的定位分类准确,对于室内声源定位技术的应用和发展具有一定的借鉴意义。
技术领域
本发明涉及一种阵列声源定位方法。特别是涉及一种基于卷积神经网络的室内麦克风阵列声源定位方法。
背景技术
基于麦克风阵列的声源定位技术被广泛应用于视频会议、语音增强、智能机器人、智能家居、车载通话设备等。其中,声源定位的应用场景分为室内环境和室外环境,室内环境是声源定位技术最常用的应用场景,区别于室外远场环境,室内环境下混响严重,对定位精度有很大影响。室内麦克风阵列声源定位方法定义为:利用麦克风阵列去采集室内声源目标,经过对就接收到声音信号的一系列分析与与处理,找到声源目标的准确位置。对于室内声源定位方法来说,如何提高抗噪声和抗混响能力是长久以来的研究的重点,传统的声源定位方法,如使用最小二乘法或广义互相关法获取到达时间差进而计算声源位置的基于时延估计的声源定位方法,基于高分辨率谱估计的声源定位方法,以及基于可控波束形成的声源定位方法,在低信噪比、高混响环境下,定位效果很差。
随着机器学习和深度学习的快速发展,许多传统的问题都可以使用该方法解决,室内声源定位问题也不例外。其中,2006年,有人利用房间声学特性和麦克风之间不匹配引起的阵元间相位差,提出基于高斯混合模型(Gaussion Mixture Modle,GMM)的声源定位方法,对预设位置建立相位差的高斯混合模型,当声源发声时,利用麦克风对间的相位差建立预测的 GMM模型,然后与预设位置的GMM模型相比较,声源位置为计算出的最大后验概率所对应的位置。2009年,有人提出一种基于支持向量机(Least-squares Support VectorMachine,LS-SVM)的声源定位方法,对于解决在噪声和混响条件下二维定向问题有一定效果。 2015年,有人提出基于BP神经网络(Back Propagation Neural Networks,BP NeuralNetworks) 的声源定位方法,对于在混响和噪声环境下二维定向问题比LS-SVM的方法有更小的均方根误差。2017年,有人提出一种基于概率神经网络(Probabilistic NeuralNetwork,PNN)的声源定位方法,其最重要的优点是它不需要任何迭代训练,定位速度快而且有一定的抗混响和噪声的性能。上述方法虽然与传统方法相比,定位效果有一定的提升,但是,在低信噪比、高混响环境下,还是无法达到较高的定位精度。
发明内容
本发明所要解决的技术问题是,提供一种可以实现距离、方向角、俯仰角三维定位的基于卷积神经网络的室内麦克风阵列声源定位方法。
本发明所采用的技术方案是:一种基于卷积神经网络的室内麦克风阵列声源定位方法,包括如下步骤:
1)建立体现室内脉冲响应的混响仿真模型,根据混响仿真模型建立室内声源信号传播模型;
2)提取声音信号矩阵X的特征,即加权广义互相关函数;
3)卷积神经网络训练所提取的特征。
步骤1)是使用Roomsim仿真工具模拟室内脉冲响应建立混响仿真模型如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910254676.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种AOA定位优化补偿方法
- 下一篇:一种用于声源定位的麦克风阵列方法