[发明专利]基于麦克风阵列的语音增强方法及系统有效
申请号: | 201910823446.7 | 申请日: | 2019-09-02 |
公开(公告)号: | CN110544486B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 张南雄;李宏斌 | 申请(专利权)人: | 上海其高电子科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200090 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 麦克风 阵列 语音 增强 方法 系统 | ||
1.一种基于麦克风阵列的语音增强方法,其特征在于,根据视频图像校准各个麦克风之间的相对传递函数,通过声压分布图获得监视范围内的噪声分布情况并对应采用语音增强算法或噪声抑制算法对麦克风阵列采集到的信号进行合并处理,最后利用基于最小p范数算法的均衡器处理得到增强后的语音信号;
所述的相对传递函数包括各个麦克风之间的相位误差以及由当前系统工作环境所引入的相位误差;
所述的合并处理是指:将经语音增强或噪声抑制算法将各个麦克风采集到的信号降为单通道信号后采用均衡器滤波以得到听感优化的最终语音信号;
所述的对应采用,具体为:当声压分布情况显示只有一个声源,且声压最大值与最小值的差大于等于6dB,则噪声抑制算法;当声压分布情况显示无明显的声源且声源最大值与最小值差小于6dB,则语音增强算法。
2.一种实现上述权利要求1所述方法的系统,其特征在于,包括:用于采集场景中的音频及视频信号的语音信号音视频采集模块、用于搜寻场景中噪声来源的声源定位模块、用于对采集到的音频信号进行噪声抑制和语音增强的语音增强与抑制模块、用于对语音增强后的信号进行频域均衡以提高语音信号清晰度的均衡器;
所述的声源定位模块包括:声源定位单元、声源分布累加单元、重置累加单元及判决单元,其中:声源定位单元通过波束成型的算法将波束成型的结果传输至声源分布累加单元,声源分布累加单元再未收到重置命令前不断累加声源定位单元发送来的结果,重置累加单元通过声源分布累加单元当前累加的声压的分布情况输出至判决单元,判决单元根据判据通知语音增强与抑制模块使用增强算法或使用噪声抑制算法;
所述的判据为:当声压分布情况显示只有一个声源,且声压最大值与最小值的差大于6dB,则噪声抑制算法;反之,当声压分布情况显示无明显的声源且声源最大值与最小值差小于6dB,则语音增强算法。
3.根据权利要求2所述的系统,其特征是,所述的语音增强与抑制模块,包括:判决接收单元、分数延迟滤波器设计单元、噪声抑制滤波器设计单元、滤波单元、叠加单元及输出单元,判决接收单元接收声源定位模块的判决;当判决接收单元选择语音增强算法则从分数延迟滤波器设计单元中选取每一路信号对应的分数延迟滤波器系数,当判决接收单元选择噪声抑制算法,则噪声抑制滤波器设计单元根据当前需要抑制的位置设计出每个通道的滤波器系数;通过分数延迟滤波器设计单元或噪声抑制滤波器设计单元设计的滤波器将采集的信号通过滤波单元进行滤波,并通过叠加单元将所有滤波后的信号相加发送至输出单元,输出单元将处理的结果发送至均衡器。
4.根据权利要求2所述的系统,其特征是,所述的声压的分布情况,即声压分布图,具体为:其中:V(k,w)为波数成型的均方值,k为聚焦方向,w为角频率,M为传感器数量,Cnm为m号传声器接收声压信号相对于n号传声器接收声压信号的互谱,rm为m号传声器的坐标向量,rn为n号传声器的坐标向量。
5.根据权利要求2所述的系统,其特征是,所述的滤波器系数,具体为通过拉格朗日插值算法设计分数延迟的滤波器系数,即求解滤波器系数其中:延时量D包括整数部分Z和小数部分p,n=0,1,...,N。
6.根据上述权利要求2~5中任一所述的系统,其特征是,所述的语音增强算法的具体步骤包括:
S3.1.1将语音增强的区域划分为40×30个网格并给予每个网格编号,每个网格对应一组分数延迟的滤波器系数;
S3.1.2根据每个网格点到达麦克风坐标的时间差,计算出每一路数据需要延迟的时间;
S3.1.3通过拉格朗日插值算法设计分数延迟的滤波器系数,即求解滤波器系数其中:延时量D包括整数部分Z和小数部分p,n=0,1,...,N;
S3.1.4设置并预存1200组滤波器系数,根据选择的增强区域调取对应的滤波器系数,将各个麦克风采集到的信号通过对应滤波器后全部叠加得到单通道信号。
7.根据权利要求2~4中任一所述的系统,其特征是,所述的噪声抑制算法,在频域通过线性约束最小方差法设定约束方程并求解得到滤波器系数,并以该滤波器系数抑制噪声源,其具体步骤包括:
S3.2.1根据每个噪声抑制点到每一个麦克风的时间差Δt和需要抑制的频率范围200-4000Hz,计算频率范围内每个频点f的的旋转因子C=e-i2πf·Δt;
S3.2.2设定约束条件:F=[f0,f1...,fk-1]T,其中:f0=1,fk=0,k=1,...K-1,即增强点为1,抑制点为0,K表示非抑制点与抑制点的个数总和,求解约束方程CTw=F,其中:w为滤波器的频域幅度响应,200-4000Hz以外的w设为0;
S3.2.3对滤波器系数w进行反傅里叶变化获得滤波器系数h;
S3.2.4对各个麦克风采集到的信号分别使用S3.2.3求得的滤波器进行滤波后全部叠加得到单通道信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海其高电子科技有限公司,未经上海其高电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910823446.7/1.html,转载请声明来源钻瓜专利网。