[发明专利]一种麦克风阵列声源空间实时定位方法有效

申请号：	201610391351.9	申请日：	2016-06-03
公开（公告）号：	CN106093864B	公开（公告）日：	2018-04-17
发明（设计）人：	杨毅;孙甲松	申请（专利权）人：	清华大学
主分类号：	G01S5/18	分类号：	G01S5/18
代理公司：	西安智大知识产权代理事务所61215	代理人：	段俊涛
地址：	100084 北京市海淀区1***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种麦克风阵列声源空间实时定位方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于语音技术领域，特别涉及一种麦克风阵列声源空间实时定位方法。

背景技术

语音处理技术中通常需要掌握声源的空间位置信息，为声纹识别、语音内容识别等交互技术提供帮助。例如，当用户与智能机器人进行语音对话时，通常要确定人的空间位置并进行转向和靠近，即使在黑暗中也可以仅仅根据声音确定用户的具体方位，并自动靠近说话人附近，提供必要的服务和帮助；在视频会议中一般需要自动调整会议摄像头，朝向发言人，并能够对不同发言人进行视频切换。

常见的用于声源定位的设备是麦克风阵列，一般定义为：由多个(通常大于三个)麦克风按照指定的几何规则摆放并完全同步采集声音信号的设备。目前麦克风阵列定位的常用方法主要包括：基于到达时间差(Time Delay ofArrival，TDOA)的声源定位，定位首先通过时延估计得到声源信号到达不同阵元的时间差，再通过麦克风阵列的几何构造进行声源位置判断；基于可控功率响应(Steered Response Power，SRP)的声源定位以及基于高分辨率谱估计(High-resolution Spectral Estimation)的声源定位等。

1、到达时间差(Time Delay ofArrival，TDOA)法：

该方法首先通过时延估计得到声源信号到达不同阵元的时间差，再通过麦克风阵列的几何构造进行声源位置判断。常用的时延估计方法是基于广义互相关(Generalized Cross Correlation，GCC)法，其具体步骤为，设X_i(ω)和X_i(ω)分别代表第i个麦克风接收信号x_i(t)和第j个麦克风接收信号x_j(t)的傅里叶变换，则有如下等式：

其中Ψ_ij(ω)表示两个信号的互功率谱密度，R_ij表示两个信号的互相关函数，为声源到第i个麦克风与第j个麦克风之间的延时估计，W_ij(ω)是频域加权系数，当此加权系数为1时，就是基本互相关。常用的频域加权函数还有相位变换(PhAse Transform，PHAT)加权、ROTH加权、最大似然加权、SCOT加权等，其中PHAT加权较为常用，因为基于广义互相关的时延估计信息隐藏在互功率谱的相位信息中，与幅度无关，PHAT加权法则去除了幅度信息的影响，使得相关函数峰值更加尖锐。PHAT加权函数公式为W_ij(ω)＝1/|Ψ_ij(ω)|。

上述基于到达时间差的定位方法原理简单，计算效率高，但在较大的噪声或混响干扰下其时延估计性能急剧下降，因此不适用于低信噪比或高混响的声学场景。此外，还有一些时延估计方法，比如利用信息论中联合熵和互信息，使用迭代方法，或者考虑不同信道的非对称性等方法，但在强混响和噪声条件下，结果都不太理想，且部分方法计算速度缓慢，比如迭代法等。

2、可控功率响应-相位变换(Steered Response Power-PhAse Transform，SRP-PHAT)法

基于可控功率响应-相位变换的定位方法通过对全局空间进行搜索，找到最大可控功率输出的点，网格越小，搜索分辨率越高。其声源定位原理如下：

假定声源位于s处，τ_i表示声源到第i个麦克风的传输延迟。声源s的可控功率响应-相位变换输出P^PHAT(s)为：

其中表示两个信号的互功率谱密度，τ_ji表示s处声源到第j个麦克风和第i个麦克风的时延差。估计的声源位置为：

经过以上分析可以知道，SRP-PHAT算法的思路是假定空间中某一位置存在声源，然后求出该位置的基于相位加权的可控功率输出，最终选取使得P^PHAT(s)最大的空间位置s作为估计出的声源位置。但是SRP-PHAT的思路是先假定空间中某一位置有声源，为了精确定位出声源信息，一般需要用网格搜索法，遍历空间中所有的网格位置。假设搜索空间c长宽高分别为X，Y，Z，网格间隔为δ，则网格点数N为：

假定X＝3m，Y＝3m，Z＝2m，网格间隔δ＝0.01m，则网格点数N＝301*301*201＝18210801，也就是说要计算接近1800多万个点的即使只有二维，也要计算301*301＝90601次，因此效率很低。

3、随机区域收缩法

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201610391351.9/2.html，转载请声明来源钻瓜专利网。

上一篇：一种高层建筑的复合式能源综合利用系统及控制方法
下一篇：一种蛇皮果专用肥及其制备方法

同类专利

专利分类

G 物理

G01 测量；测试
G01S 无线电定向；无线电导航；采用无线电波测距或测速；采用无线电波的反射或再辐射的定位或存在检测；采用其他波的类似装置
G01S5-00 通过确定两个或更多个方向或位置线的配合来定位；通过确定两个或更多个距离的配合进行定位
G01S5-02 .利用无线电波
G01S5-16 .应用了除无线电波外的其他电磁波
G01S5-18 .应用了超声波、声波或次声波
G01S5-20 ..由多个分隔开的定向器确定的信号源位置
G01S5-22 ..用多条由路径差测量确定的位置线的配合确定信号源的位置

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种麦克风阵列声源空间实时定位方法有效

专利文献下载