[发明专利]掩蔽阈值估计方法、装置、电子设备和存储介质在审
申请号: | 202111250359.0 | 申请日: | 2021-10-26 |
公开(公告)号: | CN113851151A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 秦永红;付贤会;刘武钊 | 申请(专利权)人: | 北京融讯科创技术有限公司 |
主分类号: | G10L25/84 | 分类号: | G10L25/84;G10L21/0272;G10L21/0208;G10L25/18;G10L25/30 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 潘登 |
地址: | 100038 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 掩蔽 阈值 估计 方法 装置 电子设备 存储 介质 | ||
本发明实施例公开了一种掩蔽阈值估计方法、装置、电子设备和存储介质。该方法包括:获取带噪语音信号的幅值谱,以及获取带噪语音信号中噪声信号的幅值谱;根据带噪语音信号的幅值谱和噪声信号的幅值谱确定带噪语音信号的语音特征谱偏差,以及根据带噪语音信号的幅值谱确定语音特征平坦度;根据语音特征谱偏差以及语音特征平坦度,确定带噪语音信号中不同频带的纯音系数;根据带噪语音信号的功率谱和带噪语音信号的幅值谱,以及纯音系数确定中间掩蔽阈值;根据预先确定的绝对掩蔽阈值和中间掩蔽阈值的比较结果,确定目标掩蔽阈值。本发明实施例可提高掩蔽阈值估计的准确度,进而能够有效增强噪声抑制结果,提高语音的识别效果。
技术领域
本发明实施例涉及信号处理技术领域,尤其涉及一种掩蔽阈值估计方法、装置、电子设备和存储介质。
背景技术
随着信号处理技术和语音识别技术的迅速发展,前端预处理中的语音增强技术也变得越来越重要。一般情况下,当设备播放声音时,噪声都会伴随着语音一起被听到,然而噪声的存在会对语音产生干扰,甚至会影响人耳对语音的感知。通常情况下,会采用盲源分离技术,盲源分离技术当前最主要的技术手段就是估计掩蔽阈值。
目前,在非平稳环境下,许多噪声估计算法会出现跟踪延迟、误差较大等问题,部分研究人员尝试在非平稳环境下,利用人耳的听觉特性进行语音增强,但是掩蔽阈值的估计准确度成为基于听觉特性进行语音增强的关键。
因此,如何提高掩蔽阈值的估计准确度,是本领域技术人员亟待解决的技术问题。
发明内容
本发明实施例提供一种掩蔽阈值估计方法、装置、电子设备和存储介质,可以提高掩蔽阈值的估计准确度。
第一方面,本发明实施例提供了一种掩蔽阈值估计方法,包括:
获取带噪语音信号的幅值谱,以及获取所述带噪语音信号中噪声信号的幅值谱;其中,所述带噪语音信号包括纯净语音信号和噪声信号;
根据所述带噪语音信号的幅值谱和所述噪声信号的幅值谱确定所述带噪语音信号的语音特征谱偏差,以及根据所述带噪语音信号的幅值谱确定语音特征平坦度;
根据所述语音特征谱偏差以及所述语音特征平坦度,确定所述带噪语音信号中不同频带的纯音系数;
根据所述纯音系数确定中间掩蔽阈值;
根据预先确定的绝对掩蔽阈值和所述中间掩蔽阈值的比较结果,确定目标掩蔽阈值。
第二方面,本发明实施例还提供了一种掩蔽阈值估计装置,包括:
基本参数获取模块,用于获取带噪语音信号的幅值谱,以及获取所述带噪语音信号中噪声信号的幅值谱;其中,所述带噪语音信号包括纯净语音信号和噪声信号;
特征参数确定模块,用于根据所述带噪语音信号的幅值谱和所述噪声信号的幅值谱确定所述带噪语音信号的语音特征谱偏差,以及根据所述带噪语音信号的幅值谱确定语音特征平坦度;
纯音系数确定模块,用于根据所述语音特征谱偏差以及所述语音特征平坦度,确定所述带噪语音信号中不同频带的纯音系数;
中间掩蔽阈值确定模块,用于根据所述纯音系数确定中间掩蔽阈值;
目标掩蔽阈值确定模块,用于根据预先确定的绝对掩蔽阈值和所述中间掩蔽阈值的比较结果,确定目标掩蔽阈值。
第三方面,本发明实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任一实施例所述的掩蔽阈值估计方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京融讯科创技术有限公司,未经北京融讯科创技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111250359.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铝合金钎焊复合板及其制备方法与应用
- 下一篇:一种化学实验用安全保护装置