[发明专利]掩蔽阈值估计方法、装置、电子设备和存储介质在审

申请号：	202111250359.0	申请日：	2021-10-26
公开（公告）号：	CN113851151A	公开（公告）日：	2021-12-28
发明（设计）人：	秦永红;付贤会;刘武钊	申请（专利权）人：	北京融讯科创技术有限公司
主分类号：	G10L25/84	分类号：	G10L25/84;G10L21/0272;G10L21/0208;G10L25/18;G10L25/30
代理公司：	北京品源专利代理有限公司 11332	代理人：	潘登
地址：	100038 北京市大兴区北京经济***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	掩蔽阈值估计方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种掩蔽阈值估计方法、装置、电子设备和存储介质。该方法包括：获取带噪语音信号的幅值谱，以及获取带噪语音信号中噪声信号的幅值谱；根据带噪语音信号的幅值谱和噪声信号的幅值谱确定带噪语音信号的语音特征谱偏差，以及根据带噪语音信号的幅值谱确定语音特征平坦度；根据语音特征谱偏差以及语音特征平坦度，确定带噪语音信号中不同频带的纯音系数；根据带噪语音信号的功率谱和带噪语音信号的幅值谱，以及纯音系数确定中间掩蔽阈值；根据预先确定的绝对掩蔽阈值和中间掩蔽阈值的比较结果，确定目标掩蔽阈值。本发明实施例可提高掩蔽阈值估计的准确度，进而能够有效增强噪声抑制结果，提高语音的识别效果。

技术领域

本发明实施例涉及信号处理技术领域，尤其涉及一种掩蔽阈值估计方法、装置、电子设备和存储介质。

背景技术

随着信号处理技术和语音识别技术的迅速发展，前端预处理中的语音增强技术也变得越来越重要。一般情况下，当设备播放声音时，噪声都会伴随着语音一起被听到，然而噪声的存在会对语音产生干扰，甚至会影响人耳对语音的感知。通常情况下，会采用盲源分离技术，盲源分离技术当前最主要的技术手段就是估计掩蔽阈值。

目前，在非平稳环境下，许多噪声估计算法会出现跟踪延迟、误差较大等问题，部分研究人员尝试在非平稳环境下，利用人耳的听觉特性进行语音增强，但是掩蔽阈值的估计准确度成为基于听觉特性进行语音增强的关键。

因此，如何提高掩蔽阈值的估计准确度，是本领域技术人员亟待解决的技术问题。

发明内容

本发明实施例提供一种掩蔽阈值估计方法、装置、电子设备和存储介质，可以提高掩蔽阈值的估计准确度。

第一方面，本发明实施例提供了一种掩蔽阈值估计方法，包括：

获取带噪语音信号的幅值谱，以及获取所述带噪语音信号中噪声信号的幅值谱；其中，所述带噪语音信号包括纯净语音信号和噪声信号；

根据所述带噪语音信号的幅值谱和所述噪声信号的幅值谱确定所述带噪语音信号的语音特征谱偏差，以及根据所述带噪语音信号的幅值谱确定语音特征平坦度；

根据所述语音特征谱偏差以及所述语音特征平坦度，确定所述带噪语音信号中不同频带的纯音系数；