[发明专利]应用于双麦克风阵列的语音增强方法有效

申请号：	201610356558.2	申请日：	2016-05-20
公开（公告）号：	CN105788607B	公开（公告）日：	2020-01-03
发明（设计）人：	叶中付;徐杨飞;罗友	申请（专利权）人：	中国科学技术大学
主分类号：	G10L21/0224	分类号：	G10L21/0224;G10L21/0232;G10L21/0216
代理公司：	11260 北京凯特来知识产权代理有限公司	代理人：	郑立明;郑哲
地址：	230026 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	应用于麦克风阵列语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种应用于双麦克风阵列的语音增强方法，其特征在于，包括：

利用双麦克风通道语音信号的相位差构建时频掩码滤波器滤除非平稳方向性噪声；

采用谐波重建算法对时频掩码滤波之后的语音信号进行重建，获得相应的滤波器，并基于该滤波器对原始带噪信号进行滤波，从而恢复出期望的干净语音信号，实现语音信号的增强；

其中，所述利用双麦克风通道语音信号的相位差构建时频掩码滤波器滤除非平稳方向性噪声包括：

主麦克风与次麦克风接收到的语音信号如下：

其中，x_i(t)为t时刻第i个麦克风接收到的带噪语音信号，s(t)为t时刻的源信号，h_i为源信号在第i个麦克风里的传输衰减，n_i(t)为t时刻第i个麦克风接收到的噪声信号，τ表示源信号到达两个麦克风的时间差；

对x_i(t)做短时傅里叶变换，得到：

其中，t和f分别表示时间点和频率点；e^jθ表示时域上的时间差τ经过短时傅里叶变换变换后在短时频域上相对应的相位差；

利用语音传播参数估计的思想，输入一个角度，并期望增强该角度附近的语音信号；此方法基于两个假设：任何一个时频点，只有一个信号起主要作用；声音的传播模型为h_i(f)≈λ_i·exp(-j2πfτ_i)；其中，λ_i是源信号到第i个麦克风的衰减，τ_i是相应的延时，j表示虚数；

首先对X₂的每一帧做幅度和相位以及频率归一化：

其中，X₂(t,:)为次麦克风每个时间点t对应的一帧信号，频率点f为一帧信号中的一个变量；abs()表示取该帧信号每个元素的绝对值，|| ||表示取范数操作，⊙为点乘操作，angle()表示取信号的相位角操作；

经过上述操作后，每个时频点处两麦克风间到达时间差TDOA为：

其中，L为分析窗的窗长，Fs为采样频率，而期望增强的角度对应的TDOA为τ_exp＝-d/v×cos(φ*π/180)；其中，d为两个麦克分的间距，φ为波达方向角度；

对于每个时频点(t,f)如果|τ(t,f)-τ_exp|之差大于等于阈值ε，则认为该时频点的来波方向不是来自于输入的角度附近，即在该时频点不是期望的信号占主导作用，掩码为0；反之，则认为该时频点是期望的信号占主导作用，掩码为1，则根据每个时频点的TDOA构建时频掩码滤波器c，并对带噪语音进行X₁或者X₂滤波，表示为：

或者，

其中，为对主麦克风接收信号进行滤波后的时频域信号，为对次麦克风接收信号进行滤波后的时频域信号。

2.根据权利要求1所述的一种应用于双麦克风阵列的语音增强方法，其特征在于，所述采用谐波重建算法对时频掩码滤波之后的语音信号进行重建，获得相应的滤波器，并基于该滤波器对原始带噪信号进行滤波，从而恢复出期望的干净语音信号，包括：

利用非线性函数对滤波后的语音信号进行谐波重建，若针对滤波后的主麦克风信号，则先对其进行逆短时傅里叶变换及叠接相加得到相对应的时域信号再利用下式进行谐波重建：

其中，NL表示非线性函数，s_harmo(t)为谐波重建之后的时域语音信号；

采用的非线性函数为过零比较函数Max，则有：

其中，

假设当前帧的语音信号为浊音，且为周期为T的准周期信号，则非线性函数p(·)在当前帧为周期为T的矩形窗函数，其傅里叶变换为：

其中，为Sinc函数在离散频率处的值，δ(·)为单位冲击函数，即有：

上述傅立叶变换的表达式为一个内插函数，且插值的间隔为T；即在当前时间帧内第k个谐波成分丢失，则其能通过其他的谐波成分来对该频点处的值进行恢复：

上式中，θ₀为原始信号的初始相位角，为卷积操作符；

对谐波重建之后的时域语音信号s_harmo(t)与重建之前的时域信号分别进行短时傅里叶变换，得到对应的时频域信号S_harmo(t,f)和从而估计掩码器c在码值为0点处的信噪比：