[发明专利]改进ACRANC与波束形成的微型阵列语音降噪方法有效
申请号: | 201811275824.4 | 申请日: | 2018-10-30 |
公开(公告)号: | CN109243482B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 曾庆宁;罗瀛;方韶劻;林凤梅;谢先明;龙超 | 申请(专利权)人: | 深圳市昂思科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 周雯 |
地址: | 518101 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 改进 acranc 波束 形成 微型 阵列 语音 方法 | ||
1.一种改进ACRANC与波束形成的微型阵列语音降噪方法,其特征在于,通过输入多路畸变语音到恢复滤波器并与波束形成相结合进行语音降噪,包括以下步骤:
(一)对ACRANC方法进行改进,具体分步骤如下:
(1)通过多路自适应噪声抵消获得多路降噪后的畸变语音信号,其具体过程如下:
假设语音信号为s(k),噪声信号为n(k),它们通过多条路径分别到达麦克风Mi并转化成信号si(k)和ni(k);从语音源和噪声源到达麦克风Mi的传播冲激响应假设为hsi(k)和hni(k);麦克风Mi实际拾取的信号表示为xi(k)=si(k)+ni(k),其中i=1,2,…N,k=0,1,2,…,式中N表示阵列中麦克风的个数,k是离散时间序号,得出:
xi(k)=si(k)+ni(k) (1)
si(k)=hsi(k)*s(k) (2)
ni(k)=hni(k)*n(k) i=1,2,…,N (3)
式中*是卷积运算符号;
设语音信号si到语音信号sj的中间传播的冲击响应为而噪声信号ni到噪声信号nj的中间传播冲击响应为则:
该分步骤中,对每一个麦克风Mi,以麦克风Mi获得的信号xi(k)作为主路信号,而其它N-1个麦克风获得的信号xj(k)(j=1,…,i-1,i+1,…,N)作为参考信号;在全局无声阶段,即各路信号都为无声的阶段,通过滤波器Ai用多路参考信号中的噪声去自适应地抵消主路中的噪声;而在非全局无声阶段,保持滤波器Ai的系数不变,只作滤波输出;于是,可获得多路畸变语音信号;原因如下:
由于在全局无声阶段的语音信号si(k)=0,i=1,2,…,N,因此有:
xi(k)=yi1(k)+ei1(k) (6)
ni(k)=wini(k)+erri(k) (7)
式中xi(k)=ni(k),ei1(k)=erri(k)是预测误差,yi1=wini(k)是滤波器Ai的输出,wi是1×(N-1)(L+1)维的滤波器Ai的系数行向量,即:
wi=(wi1,…,wi(i-1),wi(i+1)…,wN) (8)
式中wij=(wij0,wij1,…,wijL),ni(k)是(N-1)(L+1)×1维的噪声信号列向量;
ni(k)=[ni1(k),…,ni(i-1)(k),ni(i+1)(k),…,niN(k)]T (9)
式中nij(k)=[nij(k),nij(k-1),…,nij(k-L)]T,L是参考通道噪声信号延迟的样点数;
设最小误差功率为P[erri0(k)],而相应的最优系数向量为:
为求得上述和P[erri0(k)],只需调节滤波器Ai的系数以使ei1的平方和最小即可;
在紧随全局无声阶段后面的阶段,在假定噪声环境是不变或缓慢变化的条件下,保持滤波器Ai的最优系数不变,只作滤波输出,于是有:
式中xi(k)和si(k)分别表示拾取的含噪语音向量和纯语音向量,由式(6)与式(11)有:
其中:
上述ei1(k)是一路含有残余噪声的畸变语音,pi(k)便是其中的畸变的语音,由式(13)可见,它其实由N路中的纯净语音信号畸变而来;
ei1(k)是将第i路信号作为主信号,其它信号作为参考信号而得到的,如果让i从1至N,即分别将各路信号当作主信号,其余信号作为参考信号,那么就可得到N路含残余噪声的畸变语音信号ej1(k)(j=1,2,…N);
(2)将多路畸变语音信号作为ACRANC系统中恢复滤波器的输入,从而获得降噪语音,其具体过程如下:
将多路畸变语音信号ej1(k)(j=1,2,…N),输入ACRANC系统中的第二级滤波器Bi,在全局无声阶段以外的阶段,调节滤波器Bi的系数以使其输出e2i(k)的平方和最小,其中:
||ei2(k)||2=||xi(k)-yi2(k)||2
=||si(k)+ni(k)-yi2(k)||2
=||ni(k)||2+||si(k)-yi2(k)||2+2ni(k)[si(k)-yi2(k)] (14)
由式(15)可见,最小化等价于最小化E[si(k)-yi2(k)2],而后者相当于最小化yi2(k)与语音si(k)的误差,故滤波器Bi的输出yi2(k)能够逼近纯净语音信号si(k);由于滤波器Bi的输入不仅仅是单路而是多路畸变语音信号,因而可获得比ACRANC更好的语音降噪效果,记更好的语音降噪信号为 ;
(二)波束形成,通过将改进ACRANC与波束形成相结合,进一步提高语音降噪效果,具体分步骤如下:
(1)建立多个改进ACRANC子系统以及自适应模式控制AMC子系统,获得多路降噪语音,其具体过程如下:
以每一路信号作为主信号,其余信号作为参考信号,都建立一个改进的ACRANC,从而建立起N个这样的子系统;
在每个改进的ACRANC中,滤波器Bi的输入是所有滤波器Ai(i=1,2,…N)的输出,而非一个滤波器Ai的输出;自适应模式控制AMC用于控制这些子系统中的滤波器何时更新系数以及何时固定系数不变;
在没有语音的无声阶段即NVP阶段,可通过调整滤波器Ai的最优系数来补偿环境因素变化引起的误差;为此,定义一个全局无声阶段即ONVP阶段,各个子系统的第一级滤波器Ai只在ONVP期间调整最优系数;
由麦克风Mi拾取得第i路含噪语音信号xi(k)的无声阶段设为NVP(i),NVP(i)由一系列离散区间组成,即:
其中离散区间:
[k′ij,k″ij]={k′ij,k′ij+1,…,k″ij}
该离散区间为xi(k)的第j个NVP,显然NVP(i1)未必与NVP(i2)相等,i1≠i2,i1,i2∈{1,2,…,N}.但NVP(i1)只是NVP(i2)在时间轴上的平移结果;
定义ONVP为:
于是,容易证明:
其中:
如果k″j<k′j,则定义式(18)中[k′j,k″j]=φ;
调整滤波器Ai的最优系数时,任何一路信号中都不应含有语音信号,否则,语音会被当作噪声一同抵消,因此,只在如下的L-ONVP 阶段调整滤波器Ai的系数;
其中L是参考信号输入滤波器Ai的延迟时间样点数,而:
[k′j+L,k″j]={k′j+L,k′j+L+1,…,k″j} (20)
如果k″j<k′j+L,同样定义式(26)中[k′j+L,k″j]=φ;
在L-ONVP阶段,所有信号及用到的延迟全部属于无声阶段,不包括任何语音信号,因此可以在L-ONVP阶段调整滤波器Ai的最优系数,前述中的NVP阶段指的就是L-ONVP或L-ONVP的一部分;
在(Δ,Δ')-ONVP阶段进行滤波器Ai最优系数的调整:
式中是构成第i0路信号的NVP(i0)的离散时间区间,Δ'是一个正整数,它可根据VD判决的准确性而任意选取,目的是保证所用时间区间是纯噪声区间,Δ也是一个任选的正整数,但应满足:
Δ≥L+δ+Δ' (22)
其中δ是噪声从麦克风阵的其它麦克风传播到第i0个麦克风之间的时间延迟,以延迟样点数计,最多延迟样点数为:
其中di是麦克风与麦克风Mi之间的距离,f是阵列的采样频率,而c是音频信号在空气中的传播速度;
在(Δ,Δ')-ONVP之外的阶段,每个子系统的滤波器Ai的最优系数保持原值不变,滤波器Ai只作滤波使用;
在全局无声阶段以外的其余阶段,自适应地调整所有滤波器Bi的最优系数;
(2)通过延迟求和DAS波束形成获得最终降噪语音,其具体过程如下:
每一个子系统的输出都是一路降噪后的语音信号,所有的N路输出可以输入一个波束形成器以得到更好的语音降噪效果,如果使用常用的DAS波束形成器,可通过如下的输入输出关系描述为:
式中τi是相对于阵列中选定的一个参考麦克风而言,语音到达麦克风Mi的延迟时间;参考麦克风可任选为阵列中任何一个麦克风,通常选择位于麦克风阵中央或接近中央的麦克风作为参考麦克风。
2.如权利要求1所述的改进ACRANC与波束形成的微型阵列语音降噪方法,其特征在于,所述延迟时间τi可用互相关方法或者广义互相关方法或者下述方法计算:
1)选取一个(δ,T)_OVP离散时间区间[k',k],满足k≥k”+δ而且k-(k”+δ)尽可能小;
2)寻找τi满足:
如果麦克风阵的阵列孔径很小,而且阵列信号的采样频率不是很高的话,所有的τi可视为0处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市昂思科技有限公司,未经深圳市昂思科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811275824.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音处理方法及装置
- 下一篇:一种会议发言记录的生成方法及相关装置