[发明专利]基于噪声时变环境的加权预测误差的在线去混响算法有效
申请号: | 201780080144.4 | 申请日: | 2017-12-22 |
公开(公告)号: | CN110100457B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | S.M.卡萨里;F.内斯塔;T.索尔蒙森 | 申请(专利权)人: | 辛纳普蒂克斯公司 |
主分类号: | H04R5/04 | 分类号: | H04R5/04;H04R3/04 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李湘;陈岚 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 噪声 环境 加权 预测 误差 在线 混响 算法 | ||
用于处理多声道音频信号的系统和方法包括:接收多声道时域音频输入,将输入信号变换成多个多声道频域、k个间隔的欠采样子带信号,缓冲和延迟每个声道,保存频谱帧中的每个处的用于预测滤波器估计的频谱帧的子集,估计频谱帧中的每个处的频域信号的方差,使用递归最小二乘方(RLS)算法以在线方式适应性地估计预测滤波器,使用估计的预测滤波器对每个声道进行线性滤波,对线性滤波的输出信号非线性滤波以减少残余混响和估计的方差,从而产生非线性滤波的输出信号,以及合成非线性滤波的输出信号以重构去混响的时域多声道音频信号。
相关申请的交叉引用
本申请要求于2016年12月23日提交的并且标题为“基于噪声时变环境的加权预测误差的在线去混响算法”的美国临时专利申请No.62/438860的权益和优先权,所述申请通过引用以其整体并入本文中。
技术领域
本申请总体上涉及音频处理,并且更具体地涉及多声道音频信号的去混响。
背景技术
混响减少解决方案在音频信号处理领域中是已知的。许多常规方法不适合用于实时应用中。例如,混响减少解决方案可需要数据的长缓冲以补偿混响的效应或以估计房间脉冲响应(RIR)的逆滤波器。适合于实时应用的方法在高混响和特别是高的非平稳环境中没有以合理的方式良好地执行。另外,这样的解决方案需要大量的存储器,并且对于许多低功率设备而言不是计算上高效的。
一种常规解决方案基于加权预测误差(WPE),其假设混响过程的自回归模型,即,假设能够从混响麦克风信号的先前样本预测特定时间的混响分量。期望信号可以被估计为模型的预测误差。引入固定延迟以避免语音信号的短时相关的失真。该算法不适合于实时处理,并且在噪声条件下没有以明确的方式对输入信号建模。而且,WPE方法具有高复杂性并且不是在线多输入多输出(MIMO)解决方案。WPE方法已经被扩展以用于MIMO并且被一般化以在噪声条件下使用。然而,这样的修改不适合于时变环境。已经提出了对时变环境的进一步修改,其包括用于线性滤波的WPE和波束成形与基于维纳滤波的非线性滤波的最优组合。然而,这样的提议仍然不是实时的,并且由于其高复杂性而不适合于在低功率设备中使用。
通常,对于在在线和实时应用中的使用,常规方法在复杂性和实用性上受到限制。与批处理不同,在工业中针对许多实际应用使用实时或在线处理。因此,存在对用于在线和实时去混响的改进的系统和方法的需要。
发明内容
公开了包括基于用于噪声时变环境的加权预测误差的在线去混响的实施例的系统和方法。在各种实施例中,用于处理多声道音频信号的方法包括:接收包括时域多声道音频信号的输入信号;将输入信号变换为包括多个多声道频域、k个间隔的欠采样子带信号的频域输入信号;缓冲和延迟频域输入信号的每个声道;保存在频谱帧中的每个处的预测滤波器估计的频谱帧的子集;以及通过使用递归最小二乘方(RLS)算法来估计频谱帧中的每个处的频域输入信号的方差,适应性地以在线方式估计预测滤波器。该方法还包括使用估计的预测滤波器对频域输入信号的每个声道进行线性滤波,以产生线性滤波的输出信号;非线性地对线性滤波的输出信号进行滤波以减少残余混响和估计的方差;产生非线性滤波的输出信号;以及合成非线性滤波的输出信号以重构去混响的时域多声道音频信号,其中输出声道的数目等于输入声道的数目。
在各种实施例中,方法还可包括估计频域输入信号的方差,还包括估计干净语音方差、估计噪声方差和/或估计残余语音方差。在各种实施例中,方法可还包括使用适应性RLS算法,通过将稀疏性施加到相关矩阵而独立于频域输入信号的每个频率窗口(bin)来估计在每个帧处的预测滤波器。
在各种实施例中,输入信号包括至少一个目标信号,并且非线性滤波计算每个目标信号的增强的语音信号以减少残余混响和背景噪声。方差估计过程可包括基于先前估计的预测滤波器估计新的干净语音方差,使用具有调谐参数的固定指数衰减加权函数来估计新的残余混响方差以定制音频解决方案,以及使用单麦克风噪声方差估计方法估计每个声道的噪声方差并且随后计算平均值,从而估计噪声方差。方法还可以检测突然的改变以在扬声器移动的情况下重置预测滤波器和相关矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辛纳普蒂克斯公司,未经辛纳普蒂克斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780080144.4/2.html,转载请声明来源钻瓜专利网。