[发明专利]基于半盲源分离的非线性声学回声消除方法在审
申请号: | 202110080038.4 | 申请日: | 2021-01-21 |
公开(公告)号: | CN112927706A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 程国良;卢晶 | 申请(专利权)人: | 南京大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216 |
代理公司: | 江苏法德东恒律师事务所 32305 | 代理人: | 李媛媛 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 半盲源 分离 非线性 声学 回声 消除 方法 | ||
1.基于半盲源分离的非线性声学回声消除方法,其特征在于,包括如下步骤:
步骤1,利用已知的远端输入信号获取含有非线性回声的麦克风信号;
步骤2,对远端输入信号的非线性映射进行基函数展开,将未知的非线性展开系数合并到回声路径中;
步骤3,将远端输入信号的基函数形式看作已知的参考信号,并与步骤1中的麦克风信号合并为向量形式;
步骤4,利用短时傅里叶变换得到步骤3中向量形式信号的时频域形式信号;
步骤5,采用带约束的缩放自然梯度独立向量分析实现在线半盲源分离算法,估计分离矩阵并分离出近端时频域信号;
步骤6,将步骤5分离出的近端时频域信号通过短时傅里叶逆变换得到时域的近端信号。
2.根据权利要求1所述的基于半盲源分离的非线性声学回声消除方法,其特征在于,所述步骤1中,含有非线性回声的麦克风信号表示为:
y(t)=d(t)+s(t)=h(t)*f(x(t))+s(t)
其中,t为时间,x(t)为远端输入信号,f(·)表示无记忆非线性函数,h(t)为回声路径,d(t)为回声信号,s(t)为近端信号。
3.根据权利要求1所述的基于半盲源分离的非线性声学回声消除方法,其特征在于,所述步骤2中,基函数展开式为:
其中,f(x(t))为非线性映射输入信号,φi(·)为第i阶基函数,ai为相应的展开系数,p为展开阶数。
4.根据权利要求1所述的基于半盲源分离的非线性声学回声消除方法,其特征在于,所述步骤4中,时频域形式信号表示为:
y(k,n)=[Y(k,n),X1(k,n),...,Xi(k,n),...,Xp(k,n)]T
其中,Y(k,n)和Xi(k,n)分别为麦克风信号y(t)和远端输入信号的基函数形式φi(x(t))的时频域形式,p为基函数展开阶数,k为频率序号,n为帧序号,(·)T表示转置。
5.根据权利要求1所述的基于半盲源分离的非线性声学回声消除方法,其特征在于,所述步骤5中,在线半盲源分离算法的迭代公式为:
ΔW2:p+1,:(k,n)=Op×(p+1)
W(k,n+1)=c(k,n)[W(k,n)+ηΔW(k,n)]
W2:p+1,2:p+1(k,n+1)=Ip
其中,p为基函数展开阶数,k为频率序号,n为帧序号,W(k,n)为(p+1)×(p+1)的分离矩阵,ΔW(k,n)为矩阵W(k,n)的梯度,e(k,n)为(p+1)×1的估计向量,(·)H表示共轭转置,非线性函数Φ(·)称为多元得分函数,η为学习速率,Ip+1为(p+1)×(p+1)的单位矩阵,Op×(p+1)表示p×(p+1)的零矩阵,ΔW2:p+1,:(k,n)表示由矩阵ΔW(k,n)第2到(p+1)行组成的矩阵,W1,:(k,n+1)表示矩阵W(k,n+1)的第1行,W1,1(k,n+1)表示矩阵W(k,n+1)第1行第1列的元素,W2:p+1,2:p+1(k,n+1)表示矩阵W(k,n+1)右下角p×p的方阵,Ip为p×p的单位矩阵,d(k,n)和c(k,n)为缩放因子;
则估计向量e(k,n)表示为:
e(k,n)=W(k,n)y(k,n)=[E(k,n),X1(k,n),...,Xi(k,n),…,Xp(k,n)]T
即可估计出近端时频域信号E(k,n),其中Xi(k,n)为φi(x(t))的时频域形式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110080038.4/1.html,转载请声明来源钻瓜专利网。