[发明专利]一种基于卡尔曼滤波的去混响方法及系统有效
申请号: | 201711285885.4 | 申请日: | 2017-12-07 |
公开(公告)号: | CN108172231B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 齐园蕾;杨飞然;杨军 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G10L19/04 | 分类号: | G10L19/04;G10L19/26;G10L21/0208;G10L21/0232 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卡尔 滤波 混响 方法 系统 | ||
本发明公开了一种基于卡尔曼滤波的去混响方法及系统,所述方法包括:将各麦克风采集到的原始信号进行预处理得到相应的频域信号,延迟后构成输入信号;利用卡尔曼滤波算法和时变的多通道自回归模型估计混响信号,将当前时刻的各麦克风采集到的原始信号作为参考信号,减去混响信号得到误差信号;利用卡尔曼增益矩阵和误差信号更新卡尔曼滤波器的系数;利用当前时刻各麦克风采集到的原始信号、输入信号和更新后的卡尔曼滤波器系数得到目标信号;最后,利用逆傅里叶变换将频域目标信号转换到时域。本发明的方法通过对角化卡尔曼滤波器状态向量误差协方差矩阵,降低了自适应多通道线性预测去混响算法的复杂度。
技术领域
本发明涉及语音去混响领域,特别涉及一种基于卡尔曼滤波的去混响方法及系统。
背景技术
如图1所示,由于房间边界及房间内物体对声波的反射作用,麦克风除接收到声源发出的直达声外,还有来自各个方向的反射声。一般将到达时间在直达声之后30-50ms的声信号称为早期反射声,在此之后到达的声信号称为晚期反射声,即混响拖尾。心理声学研究发现,早期反射声可增强直达声的强度,提高语音可懂度。而混响信号会掩蔽后续到达的直达声信号,导致语音模糊。另外,混响信号还会降低麦克风接收信号的语音质量,以及语音识别系统的准确识别率。在密闭房间内进行的电话会议、智能音箱等应用场景下,麦克风往往处在声源的远场。随着声源与麦克风之间距离的增加,混响对麦克风接收信号的破坏作用更加严重。另外,在语音通信系统中,环境噪声较小,麦克风接收到的信号主要受房间混响的影响,导致语音信号精确度和可懂度都有所下降,严重影响通信质量。因此,对麦克风接收信号去混响是一项十分必要的工作。
语音去混响是一个热门的研究课题。目前的解决方法主要有:
(1)线性预测残差增强算法。线性预测残差增强算法利用的语音模型为声源滤波器模型。该模型中将语音视作一串激励序列通过一个时变的全极点滤波器。对混响语音信号作线性预测分析可得到全极点滤波器系数的估计值,也就是线性预测系数。然后对麦克风接收信号作逆滤波,即可得到对应的激励信号,也就是残差信号。通过增强残差信号即可实现去混响,通过估计得到的线性预测系数可重建语音信号。
(2)谱增强方法。谱增强方法是一类经典的去混响算法。该方法通过在短时傅里叶变换域修正含噪或含混响信号,达到增强语音信号的目的。文献[1](K.Kinoshita,M.Delcroix,T.Nakatani,and M.Miyoshi,“Suppression of late reverberationeffecton speech signal using long-term multiple-step linear prediction,”IEEETrans.Audio,Speech,Lang.Process.,vol.17,no.4,pp.534–545,May 2009.)通过延迟线性预测估计晚期混响,再利用后续的谱减法实现去混响。文献[2](F.Xiong,N.Moritz,R.Rehr,J.Anemuller,B.Meyer,T.G.G.Doclo,and S.Goetze,“Robust ASR inreverberant environments using temporal cepstrum smoothing for speechenhancement and an amplitude modulation filterbank for feature extraction,”inProc.REVERB Challenge Workshop,Florence,Italy,2014.)利用最小均方误差方法估计干净的语音信号幅度谱,作为自动语音识别的预处理阶段,由晚期混响和平稳背景噪声的功率谱密度可估计干净语音信号的功率谱密度。一般情况下,谱增强方法为确定谱衰减等级需要先估计混响时间。然而,盲混响估计仍然是十分困难的问题,尤其是在含有噪声的环境,该问题的研究仍在不断进展中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711285885.4/2.html,转载请声明来源钻瓜专利网。