[发明专利]一种基于人耳掩蔽效应与贝叶斯估计的改进谱减方法在审
申请号: | 201810399586.1 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108735225A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 邓立新;吴卫鹏 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0216 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林;张赏 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 贝叶斯估计 掩蔽效应 语音信号 次谱 人耳 噪声功率谱 语音 算法 测度 反傅里叶变换 改进 计算信号 语音增强 噪声估计 整体效果 最小控制 最优估计 幅度谱 可懂度 似然比 递归 消噪 加权 失真 保证 | ||
本发明公开了一种基于人耳掩蔽效应与贝叶斯估计的改进谱减方法,包括:(1)采用改进的最小控制值递归平均算法,得到原始带噪语音的噪声功率谱估计;(2)结合求出的噪声功率谱估计对带噪语音信号进行初次谱减;(3)对初次谱减后的信号进行基于加权似然比失真测度的贝叶斯估计,计算信号的最优估计幅度谱;(4)利用人耳掩蔽效应计算第二次谱减的减参数;(5)在第二次谱减前再次进行IMCRA噪声估计,进行第二次谱减,得到最终的增强语音信号;(6)对增强后的语音信号进行反傅里叶变换得到最终的增强语音。本发明在提高算法消噪能力的同时,更好地保证了语音可懂度,从而提升了语音增强的整体效果。
技术领域
本发明涉及一种基于人耳掩蔽效应与贝叶斯估计的改进谱减方法,属于语音信号处理技术领域。
背景技术
语音是人与人之间重要的信息交流方式,但在人们利用语音进行交流与通信的过程中,总会受到各种噪声的干扰。带噪语音不仅会增加人的听觉疲劳、降低语音通信质量,而且也会使基于特征参数提取的语音处理系统性能下降。所以,为了减小背景噪声对语音质量的影响,需要进行语音增强来抑制背景噪声。
谱减法是一种传统的增强算法,其基本思想是:分别计算带噪语音信号短时幅度谱与估计的噪声信号的短时幅度谱,进行平方运算然后相减。恢复出增强语音信号时将这个结果开方,再插入带噪语音信号的相位,进行反离散傅里叶变换。谱减法的通用形式为:
Y(ω)为带噪语音的频谱信号,为噪声的频谱信号,为增强语音的频谱信号,P为1是幅度谱减,P为2是功率谱减。
谱减法的优点是运算量小,容易实现,增强效果也较好。但因为没有对语音频谱的分布进行假设,谱减法在进行增强处理后,会带来音乐噪声,这不仅对听者在听觉效果上产生一定的干扰影响,还影响后续处理,如语音编码等。因此,如何有效抑制音乐噪声,并权衡考虑增强后的语音失真与去噪效果,是改进谱减法,使其能充分发挥自身优势的重点所在。
结合人耳听觉掩蔽效应,是消除谱减法音乐噪声的一个重要思路,有人将谱减公式改进为:Yw(ω)为带噪语音的频谱信号,为增强语音的频谱信号,现有的技术方案所使用的噪声估计算法大多不够精确,如话音活动检测(VAD)或最小值统计,前者的可靠性会随着信噪比的减小而降低,而后者响应速度慢,这都会影响噪声估计的准确度,降低语音增强的效果。而且当前的技术方案也多存在一个误区,过于注重对音乐噪声的消除,反而影响了语音信号的可懂度,破坏了语音信号,甚至还会降低信噪比。
发明内容
本发明所要解决的技术问题是克服现有技术的缺陷,提供一种基于人耳掩蔽效应与贝叶斯估计的改进谱减方法,采用改进的最小控制值递归平均算法(IMCRA)进行噪声估计,对带噪语音进行两次谱减,并于两次谱减之间对语音信号进行基于加权似然比(WLR)失真测度的贝叶斯估计,以此来增强语音信号。
为解决上述技术问题,本发明提供一种基于人耳掩蔽效应与贝叶斯估计的改进谱减方法,包括以下步骤:
1)采用改进的最小控制值递归平均算法,对原始带噪语音进行噪声估计,得到噪声功率谱估计;
2)结合步骤1)求解的噪声功率谱估计对带噪语音信号进行初次谱减;
3)对初次谱减后的带噪语音信号进行基于加权似然比失真测度的贝叶斯估计,计算信号增强谱;
4)利用人耳掩蔽效应计算第二次谱减的减参数;
5)再次采用改进的最小控制值递归平均算法进行噪声估计,利用步骤4)计算的减参数对信号增强谱进行第二次谱减,得到最终的增强语音信号;
6)对增强后的语音信号进行反傅里叶变换,得到最终的增强语音。
前述的步骤1),噪声功率谱估计的具体求解如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810399586.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于分布式结构的音频修正方法及装置
- 下一篇:语音采集方法、装置及设备