[发明专利]一种低复杂度的频域盲分离方法及系统有效
申请号: | 201910207390.2 | 申请日: | 2019-03-19 |
公开(公告)号: | CN110010148B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 康坊;杨飞然;杨军 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂度 频域盲 分离 方法 系统 | ||
1.一种低复杂度的频域盲分离方法,所述方法包括:
获取麦克风阵列采集的频域分离信号;
将当前频点与前一个频点的分离信号做相关性分析,完成每一个频点的分离信号的局部排序;
将局部排序后的每个频点的分离信号与全局中心点做相关性分析,完成每一个频点的分离信号的全局排序;
对全局排序后的分离信号进行幅度调整;
将调整后的分离信号进行傅里叶变换得到时域的分离信号;
所述方法具体包括:
步骤1)对麦克风阵列采集得到的混合信号进行短时傅里叶变换得到频域信号,在每一个频点独立利用复数ICA算法对声源进行分离;得到每个频点的分离信号;
步骤2)将当前频点f的各个分离信号的能量占比序列按照不同的顺序排列组合,与前一频点已确定顺序的分离信号的能量占比序列对应位置依次计算相关系数,并确定一组均值最大的相关系数ρmax及对应的排列顺序;如果ρmax>ε,则将ρmax所对应的排列顺序作为当前频点新的声源顺序;如果ρmax≤ε,则在当前频点之前的所有已排序的频点中挑选出ρmax>0.7的频点组成集合,并计算该集合中各分离信号的能量占比序列的中心点,将当前频点的各分离信号以不同的顺序与该中心点计算相关系数,选择均值最大的相关系数所对应的排列顺序作为当前频点新的声源顺序;重复该步骤,完成每一个频点的分离信号的局部排序;
步骤3)计算局部排序后的分离信号的全频带的全局能量占比序列中心点;依次计算局部排序后各个频点的分离信号的能量占比序列按不同的排列顺序与全局能量占比序列中心点的相关系数,并将均值最大的相关系数对应的顺序作为各频点新的声源顺序;重复该步骤,直至所有频点上的声源顺序均不再改变;完成每一个频点的分离信号的全局排序;
步骤4)对全局排序后的分离信号的分离信号进行幅度调整,得到幅度调整后的分离信号;
步骤5)将步骤4)幅度调整后的分离信号进行逆短时傅里叶变换得到声源信号的时域估计信号;
所述步骤1)具体包括:
步骤1-1)将M个麦克风接收到观测信号xj(t)经过窗长为Q点的短时傅里叶变换得到频域信号Xj(l,f),t为时刻;1≤j≤M,l为时间索引,1≤l≤B,B表示为混合数据分帧处理的总帧数;f为频率索引,fs为采样频率;x(l,f)=[X1(l,f),X2(l,f),...,XM(l,f)]T是观测信号频域向量;
步骤1-2)采用频域ICA算法在每个频点独立地分离出每个声源信号,得到当前频点f的分离信号向量y(l,f):
y(l,f)=W(f)x(l,f) (3)
其中,W(f)为N×M的分离矩阵,y(l,f)=[y1(l,f),y2(l,f),...,yN(l,f)]T,N为声源的数量,yi(l,f)表示第i个分离信号,1≤i≤N;
所述步骤2)具体包括:
步骤2-1)计算当前频点f的分离信号向量y(l,f)的能量占比序列向量v(l,f)=[v1(l,f),v2(l,f),...,vN(l,f)]T:
其中,vi(l,f)表示第i个分离信号第l时间帧的能量占比,ai(f)=[a1i,a2i,...,aMi]表示分离矩阵W(f)的逆矩阵Α(f)=W-1(f)=[a1(f),...,aN(f)]的第i列向量;
步骤2-2)根据每个时间帧计算的v(l,f)组成能量占比时间序列V(f):
其中,第i列表示第i个分离信号的时间序列;将当前频点f的能量占比时间序列V(f)的列向量按不同的顺序重新组合,然后与V(f-1)的每一列向量对应地求皮尔逊相关系数ρ,并选取均值最大的相关系ρmax及对应的声源顺序;
步骤2-3)如果ρmax大于设定的阈值ε,进入步骤2-6),否则,进入步骤2-4);阈值ε的取值范围0.5≤ε≤0.7;
步骤2-4)计算当前频点f的能量占比时间序列V(f)的不同列向量组合与局部中心点mk的相关系数,局部中心点mk为:
其中,vk(f)为V(f)的第k个列向量,表示第k个分离信号的能量占比时间序列;NF表示局部频点的集合,该集合元素的选择方法为:从[1,...,f-2,f-1]中选取可信度高的频点;|NF|表示集合的长度;所述的可靠度高是指相关系数大于0.7;
步骤2-5)从步骤2-4)的相关系数中寻找一组均值最大的相关系数及对应的声源顺序;
步骤2-6)根据均值最大的相关系数ρmax对应的声源顺序得到置换矩阵P(f),对分离信号向量y(l,f)进行调整,得到局部排序的分离信号向量yp(l,f):
yp(l,f)=P(f)y(l,f) (12)
对每个频点f重复步骤2-1)至步骤2-6),直至每一个频点的分离信号完成局部排序;
所述步骤3)具体包括:
步骤3-1)计算步骤2)局部排序后的每个频点的分离信号的能量占比时间序列然后在整个频带计算全局中心点Ck:
其中,为的第k个列向量;F表示所有频点的集合,|F|表示集合的长度;
步骤3-2)将每一个频点的分离信号的能量占比时间序列的每一列向量按不同的顺序组合与Ck做相关性分析,计算相关系数;
步骤3-3)根据均值最大的相关系数所对应的声源顺序得到置换矩阵P(f),对声源顺序及对应的能量占比序列进行调整;转入步骤3-1);直到顺序不再发生变化;全局排序后的每一个频点的分离信号向量为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910207390.2/1.html,转载请声明来源钻瓜专利网。