[发明专利]应用于双麦克风阵列的语音增强方法有效
申请号: | 201610356558.2 | 申请日: | 2016-05-20 |
公开(公告)号: | CN105788607B | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 叶中付;徐杨飞;罗友 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G10L21/0224 | 分类号: | G10L21/0224;G10L21/0232;G10L21/0216 |
代理公司: | 11260 北京凯特来知识产权代理有限公司 | 代理人: | 郑立明;郑哲 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用于 麦克风 阵列 语音 增强 方法 | ||
1.一种应用于双麦克风阵列的语音增强方法,其特征在于,包括:
利用双麦克风通道语音信号的相位差构建时频掩码滤波器滤除非平稳方向性噪声;
采用谐波重建算法对时频掩码滤波之后的语音信号进行重建,获得相应的滤波器,并基于该滤波器对原始带噪信号进行滤波,从而恢复出期望的干净语音信号,实现语音信号的增强;
其中,所述利用双麦克风通道语音信号的相位差构建时频掩码滤波器滤除非平稳方向性噪声包括:
主麦克风与次麦克风接收到的语音信号如下:
其中,xi(t)为t时刻第i个麦克风接收到的带噪语音信号,s(t)为t时刻的源信号,hi为源信号在第i个麦克风里的传输衰减,ni(t)为t时刻第i个麦克风接收到的噪声信号,τ表示源信号到达两个麦克风的时间差;
对xi(t)做短时傅里叶变换,得到:
其中,t和f分别表示时间点和频率点;ejθ表示时域上的时间差τ经过短时傅里叶变换变换后在短时频域上相对应的相位差;
利用语音传播参数估计的思想,输入一个角度,并期望增强该角度附近的语音信号;此方法基于两个假设:任何一个时频点,只有一个信号起主要作用;声音的传播模型为hi(f)≈λi·exp(-j2πfτi);其中,λi是源信号到第i个麦克风的衰减,τi是相应的延时,j表示虚数;
首先对X2的每一帧做幅度和相位以及频率归一化:
其中,X2(t,:)为次麦克风每个时间点t对应的一帧信号,频率点f为一帧信号中的一个变量;abs()表示取该帧信号每个元素的绝对值,|| ||表示取范数操作,⊙为点乘操作,angle()表示取信号的相位角操作;
经过上述操作后,每个时频点处两麦克风间到达时间差TDOA为:
其中,L为分析窗的窗长,Fs为采样频率,而期望增强的角度对应的TDOA为τexp=-d/v×cos(φ*π/180);其中,d为两个麦克分的间距,φ为波达方向角度;
对于每个时频点(t,f)如果|τ(t,f)-τexp|之差大于等于阈值ε,则认为该时频点的来波方向不是来自于输入的角度附近,即在该时频点不是期望的信号占主导作用,掩码为0;反之,则认为该时频点是期望的信号占主导作用,掩码为1,则根据每个时频点的TDOA构建时频掩码滤波器c,并对带噪语音进行X1或者X2滤波,表示为:
或者,
其中,为对主麦克风接收信号进行滤波后的时频域信号,为对次麦克风接收信号进行滤波后的时频域信号。
2.根据权利要求1所述的一种应用于双麦克风阵列的语音增强方法,其特征在于,所述采用谐波重建算法对时频掩码滤波之后的语音信号进行重建,获得相应的滤波器,并基于该滤波器对原始带噪信号进行滤波,从而恢复出期望的干净语音信号,包括:
利用非线性函数对滤波后的语音信号进行谐波重建,若针对滤波后的主麦克风信号,则先对其进行逆短时傅里叶变换及叠接相加得到相对应的时域信号再利用下式进行谐波重建:
其中,NL表示非线性函数,sharmo(t)为谐波重建之后的时域语音信号;
采用的非线性函数为过零比较函数Max,则有:
其中,
假设当前帧的语音信号为浊音,且为周期为T的准周期信号,则非线性函数p(·)在当前帧为周期为T的矩形窗函数,其傅里叶变换为:
其中,为Sinc函数在离散频率处的值,δ(·)为单位冲击函数,即有:
上述傅立叶变换的表达式为一个内插函数,且插值的间隔为T;即在当前时间帧内第k个谐波成分丢失,则其能通过其他的谐波成分来对该频点处的值进行恢复:
上式中,θ0为原始信号的初始相位角,为卷积操作符;
对谐波重建之后的时域语音信号sharmo(t)与重建之前的时域信号分别进行短时傅里叶变换,得到对应的时频域信号Sharmo(t,f)和从而估计掩码器c在码值为0点处的信噪比:
上式中,ρ(t,f)为掩码器输出信号与重建信号的比重因子,且0≤ρ(t,f)≤1,为估计的噪声功率;估计方法为:
则根据估计的先验信噪比构建新的滤波器,滤波器函数为:
根据该滤波器对原始带噪信号进行滤波得到谐波重建之后的信号为
然后对上述得到的信号进行逆短时傅立叶变换及叠接相加,从而恢复出期望的干净语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610356558.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:存储器结构
- 下一篇:一种基于FXLMS的优化主动降噪方法