[发明专利]融合子带分析的双声源定位方法在审
申请号: | 201610614364.8 | 申请日: | 2016-07-29 |
公开(公告)号: | CN106226739A | 公开(公告)日: | 2016-12-14 |
发明(设计)人: | 黄丽霞;张雪英;陈宏涛;胡杰;李刚;王亚楠;昝丹斐;张晓丹 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G01S5/18 | 分类号: | G01S5/18 |
代理公司: | 太原科卫专利事务所(普通合伙)14100 | 代理人: | 朱源 |
地址: | 030024 *** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 针对现存的双声源定位算法无法克服声源间相互干扰,从而无法获得各个声源准确位置的问题。本发明提出一种融合子带分析的平滑广义互相关双声源定位方法,提高混响环境下双声源定位的性能。该方法利用语音信号在频域的稀疏性,首先将语音信号频域划分为8个不同的子带;然后对各个子带中的广义互相关函数进行多帧加权平滑,获得平滑广义互相关函数;最后融合各子带的平滑广义互相关函数获得时间延迟信息,并结合空间四元阵几何定位算法获得各个声源的三维位置估计。本发明充分利用了语音信号频域的稀疏性,克服了两声源信号间的干扰,提高了算法在混响情况下的定位精度。 | ||
搜索关键词: | 融合 分析 双声 定位 方法 | ||
【主权项】:
融合子带分析的双声源定位方法,其特征在于,利用语音信号频域的稀疏性和基于声达时间差的声源定位技术进行双声源三维空间定位,包括以下步骤:(A)麦克风阵列采集双声源混合语音信号,并对其进行预处理;(B)将经过预处理的信号划分为子带信号;(C)对各个子带信号中的语音信号进行预白化处理;(D)计算预白化处理后的各个子带中任两路麦克风信号的平滑广义互相关函数;即Smooth Generalized Cross Correlation函数,简称SGCC函数;(E)融合各个子带的SGCC函数,获得两路信号最终的SGCC函数,并根据所述SGCC函数的最大值确定声源信号到达两路麦克风的时延;(F)根据麦克风阵列的几何位置和所述双声源信号到达两个麦克风的时延值,确定声源位置;步骤(A)包括:(1)采用四元矩形阵麦克风采集双声源混合语音信号;(2)采用基于能量和过零率的双门限端点检测法确定语音信号的起始点和终止点,具体如下:对四元麦克风阵列所有麦克风接收到的信号x(n)进行分帧,每一帧表示为xi(n),n=1,2,...,N,n表示采样点,N表示帧长,i表示帧数;计算语音信号每一帧的短时帧能量:计算语音信号每一帧的过零率:其中第一级判决:首先根据语音信号的平均能量值即所有Ei的平均值设定一个较高的阈值T1,用来寻找语音的起始点;然后再利用噪声的平均能量设定一个较低的阈值T2,用来判定第一级判决中语音信号的终止点,至此第一级判决结束;第二级判决:利用噪声的平均过零率ZN即所有Zi的平均值,设定一个阈值T3,用来判定语音信号开始时的清音和结尾处的尾音;(3)采用FIR带通滤波器去除声源信号低频段和高频段的噪声,得到带通滤波后的声源信号;对带通滤波后的信号进行加窗分帧,窗函数为n表示采样点,N表示帧长;步骤(B)包括:采用FIR滤波器组将步骤(A)预处理后的语音信号均匀划分为8个不同的子带,FIR滤波器用于划分子带的冲击函数h(n)的Z变换为步骤(C)采用公式xm(n)=IFFT{FFT[xm(n)]/|FFT[xm(n)]|}对划分完子带的语音信号进行预白化处理,其中xm(n)为第m个麦克风接收到的语音信号;每个子带中都包含有所有麦克风接收到的信号,对各个子带中每个麦克风接收到的语音信号都要进行预白化处理;步骤(D)如下:设四元麦克风阵列中第m(m=1,2,3,4)个阵元接收的信号为式中,st(n)表示第t个声源信号;hmt(n)表示第t个声源与第m个麦克风之间的房间脉冲响应,即房间混响;*表示卷积;bm(n)表示房间背景噪声;每个子带中任两路麦克风信号xq(n)、xj(n)之间的广义互相关函数为式中,为麦克风q和麦克风j接收信号的互功率谱;Xq(k)为xq(n)的短时傅里叶变换;H表示共轭;N为信号的样点数即帧长;Φ(k)为加权函数;本步骤采用PHAT加权函数:式中表示麦克风q和麦克风j接收信号的加权互功率谱;引入一阶平滑滤波器对GCC‑PHAT的加权互功率谱进行平滑处理,获得:Sxqxj′′i(k)=Sxqxj′i(k)i=1(1-α)Sxqxj′′i-1(k)+αSxqxj′i(k)i≥2]]>式中,α为平滑系数,取值范围为(0<α<0.5),为经过平滑后的第i(i≥1)帧信号的加权互功率谱,为平滑前的第i(i≥1)帧信号的加权互功率谱;各个子带中任两路麦克风信号的平滑广义互相关函数计算公式为:ψ^SGCC(n)=1NΣk=0N-1Sxqxj′′i(k)ej2πnk/N;]]>步骤(E)包括:采用加权平均的方法融合各个子带中任两路麦克风信号的SGCC函数:ψ^SGCC′(n)=ΣO=1Lψ^O_SGCC(n)*gL,L=8]]>其中,式中,表示各个子带中任两路麦克风信号的SGCC函数,L表示子带数,本发明将信号划分为8个子带,g表示对每个子带SGCC函数加权的权值;对所述函数进行峰值检测,其中两个最大峰值对应的时间点即为两个声源到达两路麦克风的时延值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610614364.8/,转载请声明来源钻瓜专利网。
- 上一篇:基于声学的移动设备近场测距定位方法
- 下一篇:远场声源定位系统和方法