[发明专利]基于噪声时变环境的加权预测误差的在线去混响算法有效
申请号: | 201780080144.4 | 申请日: | 2017-12-22 |
公开(公告)号: | CN110100457B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | S.M.卡萨里;F.内斯塔;T.索尔蒙森 | 申请(专利权)人: | 辛纳普蒂克斯公司 |
主分类号: | H04R5/04 | 分类号: | H04R5/04;H04R3/04 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李湘;陈岚 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 噪声 环境 加权 预测 误差 在线 混响 算法 | ||
1.一种用于处理多声道音频信号的方法,包括:
接收包括时域多声道音频信号的输入信号;
将所述输入信号变换为频域输入信号,所述频域输入信号包括多个多声道频域、k个间隔的欠采样子带信号;
缓冲和延迟所述频域输入信号的每个声道;
保存频谱帧中的每个处的用于预测滤波器估计的所述频谱帧的子集;
估计所述频谱帧中的每个处的所述频域输入信号的方差;
至少部分地基于所估计的方差,通过使用递归最小二乘方(RLS)算法和成本函数以在线方式适应性地估计所述预测滤波器;
使用所述估计的预测滤波器对所述频域输入信号的每个声道线性滤波以减少混响,从而产生线性滤波的输出信号;
利用所估计的方差非线性地对所述线性滤波的输出信号滤波以减少残余混响,从而产生非线性滤波的输出信号;以及
合成所述非线性滤波的输出信号以重构去混响的时域多声道音频信号,其中输出声道的数目等于输入声道的数目。
2.根据权利要求1所述的方法,其中估计所述频域输入信号的所述方差还包括估计干净语音方差。
3.根据权利要求2所述的方法,其中估计所述频域输入信号的所述方差还包括估计噪声方差。
4.根据权利要求3所述的方法,其中估计所述频域输入信号的所述方差还包括估计残余语音方差。
5.根据权利要求1所述的方法,其中适应性地估计还包括:通过将稀疏性施加到相关矩阵来使用适应性RLS算法,为所述频域输入信号的每个频率窗口独立地估计每个帧处的所述预测滤波器。
6.根据权利要求5所述的方法,其还包括检测扬声器移动的变化并且响应于扬声器移动的突然变化而重置所述预测滤波器和相关矩阵。
7.根据权利要求1所述的方法,其中所述输入信号包括至少一个目标信号;并且其中所述非线性滤波针对每个目标信号计算增强的语音信号。
8.根据权利要求7所述的方法,其中所述非线性滤波减少残余混响和背景噪声。
9.根据权利要求1所述的方法,其中估计所述频域输入信号的所述方差还包括:
基于先前估计的预测滤波器估计新的干净语音方差;
使用具有用于定制音频解决方案的调谐参数的固定指数衰减加权函数来估计新的残余混响方差;以及
使用单麦克风噪声方差估计方法以估计每个声道的噪声方差并且随后计算平均值,从而估计所述噪声方差。
10.根据权利要求1所述的方法,其中缓冲和延迟所述频域输入信号的每个声道还包括为每个声道的每个子带保存多个频谱帧,其中对于至少两个子带而言,所保存的频谱帧的数目是不同的。
11.根据权利要求10所述的方法,其中至少一个子带的缓冲器长度大于为更高频率的子带而保存的帧的数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辛纳普蒂克斯公司,未经辛纳普蒂克斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780080144.4/1.html,转载请声明来源钻瓜专利网。