[发明专利]基于噪声混合相干性的双通道波束形成语音增强方法有效
申请号: | 201610167885.3 | 申请日: | 2016-03-23 |
公开(公告)号: | CN105869651B | 公开(公告)日: | 2019-05-31 |
发明(设计)人: | 刘宏;孙淼 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0208 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 邱晓锋 |
地址: | 518055 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于噪声混合相干性的双通道波束形成语音增强方法。自适应波束形成在无混响条件下可以有效地抑制方向性噪声信号,但在混响存在的条件下其效果大大降低。针对这个问题,本发明提出了一种基于噪声混合相干性的双通道波束形成方法。考虑到声场中同时存在相干性和散射性噪声,本发明提出用混合噪声声场来代替传统的散射性声场的假设,首先估计出混合噪声声场中的噪声相干性,用其来估计噪声的功率谱,并将噪声功率谱估计结果用于计算频域滤波的增益函数。噪声与混响信号经过频域滤波处理后,残留的噪声再通过最小方差无失真响应波束形成器进一步处理。实验证明利用本发明的方法增强后的语音质量相比于传统的方法有较明显的提高。 | ||
搜索关键词: | 基于 噪声 混合 相干性 双通道 波束 形成 语音 增强 方法 | ||
【主权项】:
1.一种双通道波束形成语音增强方法,其步骤包括:1)在固定时间窗内对双通道带噪语音信号依次进行分帧、加窗处理,并利用短时傅里叶变换将信号变换到频域,继而在频域上对信号进行处理;然后利用带噪语音信号计算出相干性信号与散射性信号的能量比;接着在结合噪声声源入射角度基础上,利用相干性信号与散射性信号的能量比估计噪声的混合相干性;所述混合相干性的计算方法为:其中表示相干性噪声和散射性噪声的能量比,f表示频率变量,c=340m/s表示声音在空气中的传播速度,dmic表示两个麦克风的距离;θ表示声源入射角度;2)利用混合相干性进行噪声功率谱估计,利用估计的结果计算频域滤波的增益函数;3)用频域滤波对带噪语音信号进行处理,然后用最小方差无失真响应波束形成器进一步抑制残留的噪声,得到最终增强后的语音信号,完成语音增强;步骤3)包括如下子步骤:3‑1)带噪语音信号的幅度谱乘以频域滤波器的增益函数,得到经过滤波处理后的语音信号的幅度谱;3‑2)将得到的幅度谱再乘以最小方差无失真响应波束形成器的权重,得到最终增强后的语音信号的幅度谱;3‑3)利用短时傅里叶逆变换和重叠相加法将信号变换到时域,得到时域上的增强后的信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610167885.3/,转载请声明来源钻瓜专利网。
- 上一篇:音频装置以及语音检测方法
- 下一篇:试管夹持套