[发明专利]一种利用优势声源成分移除的多声源定位方法有效
申请号: | 201910640408.8 | 申请日: | 2019-07-16 |
公开(公告)号: | CN110275138B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 吴宇轩;杨淇善;贾懋珅 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G01S5/20 | 分类号: | G01S5/20 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 优势 声源 成分 定位 方法 | ||
1.一种利用优势声源成分移除的多声源定位方法,其特征在于包括以下步骤:
步骤1,对采集信号进行分帧处理,利用短时傅里叶变换对声场麦克风采集信号进行时-频变换,获得信号的频率系数;
步骤2,将当前帧频域信号按频率划分为若干子带,计算同一频率范围子带内声场麦克风各通道间的采集信号归一化互相关系数;
步骤3,根据归一化互相关系数检测单声源子带,对单声源子带内的各时-频点进行角度估计;
步骤4,确定各帧的帧内优势声源,并计算帧内优势声源角度;
步骤5,利用历史帧的帧内优势声源确定全局候选优势声源;
步骤6,选择H′个经移除处理后的历史帧,根据这些历史帧中的时频点角度估计值属于各个全局候选优势声源的数量计算出现概率,根据出现概率对全局候选优势声源进行筛选并最终确定全局优势声源,其中H′个历史帧中的时频点角度估计值可由集合Πn表达,其中h′=1,2,…,H′,Φn-h′代表第n-h′帧经移除处理后的时-频点角度估计值集合;
步骤7,根据确定的全局优势声源角度设立移除区间,对角度估计值落入移除区间的当前帧时-频点进行移除;
步骤8,对若干帧经过移除处理后的时-频点的角度估计值进行后处理以获得声源角度估计。
2.如权利要求1所述的一种利用优势声源成分移除的多声源定位方法,其特征在于:步骤1具体为首先将声场麦克风采集的四路信号xi(n,l)分帧后进行短时傅里叶变换,得到频域系数:
其中,i=1,2,3,4为麦克风编号,n为帧索引,k=1,2,…,K为频率索引,l=1,2,…,L为时域样点索引,L为帧长,w(l)为窗函数,Xi(n,k)为频域系数;X1(n,k)对应W通道麦克风,为全指向性麦克风采集信号;X2(n,k)、X3(n,k)、X4(n,k)分别对应X、Y、Z三个空间直角坐标系下相互正交的三个通道的麦克风,为8字型指向性麦克风采集信号。
3.如权利要求1所述的一种利用优势声源成分移除的多声源定位方法,其特征在于:步骤4所述的帧内优势声源的判别方法如下:
4.1)计算所有单声源子带Ωnm对应的角度粗估计值其中角度粗估计值的计算公式如下:
4.2)根据角度粗估计值将单声源子带映射到若干个声源上,具体为:将每一帧内所有单声源子带对应的角度粗估计值按升序排列,设θ为预设的角度阈值,则相邻角度的角度差大于θ则表示两个角度分属两个声源,否则表示属于一个声源;
4.3)计算每个声源在各帧内的出现概率,其中,第q个声源在第n帧的出现概率Pnq可由下式计算:
其中q=1,2,…,Q,Bnq为第n帧属于第q个声源的单声源子带个数,为第n帧单声源子带总个数;
4.4)判断帧内优势声源,判断条件为:若Pnq大于预设阈值σ,则认为第q个声源是第n帧的帧内优势声源;
4.5)计算帧内优势声源角度,具体为:对于判断得到的帧内优势声源,将属于该帧内优势声源的各单声源子带角度粗估计值的平均值作为其角度粗估计值。
4.如权利要求1所述的一种利用优势声源成分移除的多声源定位方法,其特征在于:步骤5中所述的全局候选优势声源的确定方法如下:选取H个历史帧信息进行当前帧信息判别,首先计算第n-1,n-2,...,n-H帧中的帧内优势声源,利用这H个历史帧各自的帧内优势声源信息求取第n帧的全局候选优势声源信息,即全局候选优势声源角度集合Θn,具体可由下式表示
其中,Qn-h为第n-h帧的帧内优势声源个数,为第n-h帧的第qn-h个帧内优势声源角度,qn-h=1,2,…,Qn-h。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910640408.8/1.html,转载请声明来源钻瓜专利网。