[发明专利]基于时频掩蔽值估计的波束成形方法及系统有效
申请号: | 202011557418.4 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112735460B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 屈丹;郭晓波;杨绪魁;邱泽宇;李真;郝朝龙;魏雪娟 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L25/30;G10L15/20 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 掩蔽 估计 波束 成形 方法 系统 | ||
1.一种基于时频掩蔽值估计的波束成形方法,用于语音识别应用中的语音增强,其特征在于,包含如下内容:
获取多通道语音序列,对语音序列进行傅里叶变换并提取幅度谱特征和空域特征;
对幅度谱特征通过对数变换得到多通道语音频谱特征序列;将多通道语音频谱特征序列送入预先训练优化的神经网络模型,通过该神经网络模型获取复值时频掩蔽值;
将复值时频掩蔽值转换为语音存在概率,利用概率模型并通过模型求解来获取时频掩蔽值;
由时频掩蔽值及多通道语音序列语音特征计算语音信号协方差矩阵,通过对协方差矩阵进行特征值分解获取波束成形滤波器系数;
结合波束成形滤波器系数,利用波束成形滤波器对多通道语音序列语音特征进行滤波处理,得到增强语音信号。
2.根据权利要求1所述的基于时频掩蔽值估计的波束成形方法,其特征在于,语音序列傅里叶变换中,利用通道轴正则化观察向量的方向统计量来提取空域特征。
3.根据权利要求1所述的基于时频掩蔽值估计的波束成形方法,其特征在于,利用样本数据对神经网络模型训练优化,其中,样本数据中包含对纯净语音进行预处理后的含噪语音数据及所对应的复值时频掩蔽值标签。
4.根据权利要求3所述的基于时频掩蔽值估计的波束成形方法,其特征在于,依据纯净语音频谱、噪声频谱及含噪语音频谱对样本数据中的复值时频掩蔽值进行标签处理。
5.根据权利要求1所述的基于时频掩蔽值估计的波束成形方法,其特征在于,基于概率分布对多通道语音序列的空域特征构建概率模型,将依据复值时频掩蔽值转换得到的语音存在概率作为初始掩蔽值,通过期望最大化算法迭代更新概率模型参数来估计时频掩蔽值。
6.根据权利要求1或5所述的基于时频掩蔽值估计的波束成形方法,其特征在于,对于通过概率模型获取到处理频带宽度下不同频率的时频掩蔽值序列,计算用于表征不同时频掩蔽值序列之间的相似性的相关系数,依据相关系数获取相关系数矩阵;并依据设定排序方程score[Q]=sum(diag(Q))-sum(offdiag(Q))来获取处理频带中使得score最大值所对应的时频掩蔽值序列,将该时频掩蔽值序列作为扰动对齐处理后用于计算波束成形滤波器系数的时频掩蔽值,其中,diag(Q)和offdiag(Q)分别表示相关系数矩阵Q中对角线元素和非对角线元素。
7.根据权利要求1所述的基于时频掩蔽值估计的波束成形方法,其特征在于,由时频掩蔽值和多通道语音特征序列计算含噪语音和噪声的协方差矩阵,依据两者的协方差矩阵获取语音信号的协方差矩阵;对语音信号协方差矩阵进行特征值分解,依据最大特征值对应的特征矢量来获取导引矢量估计值;结合含噪语音协方差矩阵和导引矢量估计值获取波束成形滤波器系数。
8.一种基于时频掩蔽值估计的波束成形系统,用于语音识别应用中的语音增强,其特征在于,包含:数据收集模块、数据处理模块、数据转换模块、系数获取模块和滤波成形模块,其中,
数据收集模块,用于获取多通道语音序列,对语音序列进行傅里叶变换并提取幅度谱特征和空域特征;
数据处理模块,用于对幅度谱特征通过对数变换得到多通道语音频谱特征序列;将多通道语音频谱特征序列送入预先训练优化的神经网络模型,通过该神经网络模型获取复值时频掩蔽值;
数据转换模块,用于将复值时频掩蔽值转换为语音存在概率,利用概率模型并通过模型求解来获取时频掩蔽值;
系数获取模块,用于由时频掩蔽值及多通道语音序列语音特征计算语音信号协方差矩阵,通过对协方差矩阵进行特征值分解获取波束成形滤波器系数;
滤波成形模块,用于结合波束成形滤波器系数,利用波束成形滤波器对多通道语音序列语音特征进行滤波处理,得到增强语音信号。
9.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时执行权利要求1~7任一项所述的方法。
10.一种计算机设备,包含处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以执行权利要求1~7任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院,未经中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011557418.4/1.html,转载请声明来源钻瓜专利网。