[发明专利]基于时频掩蔽值估计的波束成形方法及系统有效
申请号: | 202011557418.4 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112735460B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 屈丹;郭晓波;杨绪魁;邱泽宇;李真;郝朝龙;魏雪娟 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L25/30;G10L15/20 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 掩蔽 估计 波束 成形 方法 系统 | ||
本发明属于语音增强技术领域,特别涉及一种基于时频掩蔽值估计的波束成形方法及系统,方法包含:获取多通道语音序列,通过傅里叶变换提取幅度谱特征和空域特征;对幅度谱特征通过对数变换得到多通道语音频谱特征序列,送入预先训练优化的神经网络模型获取复值时频掩蔽值;将复值时频掩蔽值转换为语音存在概率,利用概率模型获取时频掩蔽值;由时频掩蔽值及多通道语音特征序列计算语音信号协方差矩阵,对协方差矩阵进行特征值分解获取波束成形滤波器系数;结合波束成形滤波器系数,利用波束成形滤波器对多通道语音序列语音特征滤波处理,得到增强语音信号。本发明集成神经网络和空域聚类进行时频掩蔽值估计,提升波束形成和语音识别的性能。
技术领域
本发明属于语音增强技术领域,特别涉及一种基于时频掩蔽值估计的波束成形方法及系统。
背景技术
语音编码和语音识别研究常常是在实验室条件下进行的,也就是在信噪比很高或无噪声的环境中进行的。因此当语音处理从实验室走向实际应用时,由于实际环境噪声与干扰的存在,会使许多方法无法使用,性能急速下降。因此研究对受噪降质语音改善其听觉效果或提髙信噪比的处理,是面临的必须解决的实际问题。语音增强本质就是语音降噪,换句话说,日常生活中,麦克风采集的语音通常是带有不同噪声的“污染”语音,语音增强的主要目的就是从这些被“污染”的带噪语音中恢复出我们想要的干净语音。语音增强涉及的应用领域十分广泛,包括语音通话、电话会议、场景录音、助听器设备和语音识别设备等,并成为许多语音编码和识别系统的预处理模块。现有语音增强处理中,基于神经网络的时频掩蔽值估计存在训练-测试数据不匹配问题,影响了性能,基于空域聚类的时频掩蔽值估计存在迭代时间长的问题,同时现有实值掩蔽值都是利用了特征的幅度信息,没有充分利用特征中的相位信息,语音和噪声存在概率的估计准确性均有待提升。
发明内容
为此,本发明提供一种基于时频掩蔽值估计的波束成形方法及系统,集成神经网络和空域聚类进行时频掩蔽值估计,提升波束形成和语音识别的性能。
按照本发明所提供的设计方案,一种基于时频掩蔽值估计的波束成形方法,用于语音识别应用中的语音增强,包含如下内容:
获取多通道语音序列,对语音序列进行傅里叶变换并提取幅度谱特征和空域特征;
对幅度谱特征通过对数变换得到多通道语音频谱特征序列;将多通道语音频谱特征序列送入预先训练优化的神经网络模型,通过该神经网络模型获取复值时频掩蔽值;
将复值时频掩蔽值转换为语音存在概率,利用概率模型并通过模型求解来获取时频掩蔽值;
由时频掩蔽值及多通道语音序列语音特征计算语音信号协方差矩阵,通过对协方差矩阵进行特征值分解获取波束成形滤波器系数;
结合波束成形滤波器系数,利用波束成形滤波器对多通道语音序列语音特征进行滤波处理,得到增强语音信号。
作为本发明基于时频掩蔽值估计的波束成形方法,进一步的,语音序列傅里叶变换中,利用通道轴正则化观察向量的方向统计量来提取空域特征。
作为本发明基于时频掩蔽值估计的波束成形方法,进一步地,利用样本数据对神经网络模型训练优化,其中,样本数据中包含对纯净语音进行预处理后的含噪语音数据及所对应的复值时频掩蔽值标签。
作为本发明基于时频掩蔽值估计的波束成形方法,进一步地,依据纯净语音频谱、噪声频谱及含噪语音频谱对样本数据中的复值时频掩蔽值进行标签处理。
作为本发明基于时频掩蔽值估计的波束成形方法,进一步地,基于概率分布对多通道语音序列的空域特征构建概率模型,将依据复值时频掩蔽值转换得到的语音存在概率作为初始掩蔽值,通过期望最大化算法迭代更新概率模型参数来估计时频掩蔽值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院,未经中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011557418.4/2.html,转载请声明来源钻瓜专利网。