[发明专利]基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质有效
申请号: | 201910168105.0 | 申请日: | 2019-03-06 |
公开(公告)号: | CN109817234B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 张啟权;王明江;陆云;韩宇菲;张禄;孙凤娇 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0272;G10L25/03;G10L25/45 |
代理公司: | 深圳市添源知识产权代理事务所(普通合伙) 44451 | 代理人: | 罗志伟 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 连续 噪声 跟踪 目标 语音 信号 增强 方法 系统 存储 介质 | ||
本发明提供了一种基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质,该目标语音信号增强方法包括:步骤1:接收带噪语音信号,对带噪语音信号进行分帧加窗处理,使用短时傅里叶变换得到时频域的关系;步骤2:对噪声功率谱进行估计;步骤3:语音功率谱的估计;步骤4:通过语音估计器对语音信号进行估计;步骤5:反傅里叶变换,加窗并使用交叠相加技术实现语音恢复。本发明的有益效果是:本发明有效地把目标语音信号分离出来,大大减小了语音信号中的噪声残余量,使得目标信号的质量大大提高。这对自动语音识别、说话人识别、人机对话接口以及助听器等应用有着非常重要的作用。
技术领域
本发明涉及语音处理技术领域,尤其涉及基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质。
背景技术
生活中处处存在着噪声,语音增强算法的目的在于提高被噪声污染的目标语音信号的质量和可懂度。现有的语音增强算法通常采用语音活动检测器来估计背景噪声进而实现目标信号增强,这些算法在平稳噪声环境以及高信噪比条件下表现的良好。然而,当在低信噪比特别是在非平稳噪声环境下,这些算法的性能表现地非常有限。由于生活中的噪声比较复杂,例如汽车,火车通过,行人说话聊天都会产生各种噪声,开发一种能在非平稳噪声条件下很好工作的语音增强算法是非常有必要的。
发明内容
本发明提供了一种基于连续噪声跟踪的目标语音信号增强方法,包括如下步骤:
步骤1:接收带噪语音信号,对带噪语音信号进行分帧加窗处理,然后使用短时傅里叶变换得到时频域的关系;
步骤2:对噪声功率谱进行估计;
步骤3:纯净语音功率谱的估计;
步骤4:通过语音估计器对纯净语音信号进行估计,对于语音估计器的先验信噪比,利用判决引导算法估计器来实现;
步骤5:反傅里叶变换,加窗并使用交叠相加技术实现纯净语音恢复。
作为本发明的进一步改进,在所述步骤2中,使用噪声功率的最小均方误差估计器来对噪声功率谱进行估计。
作为本发明的进一步改进,在所述步骤3中,使用基于语音存在概率的最小均方误差估计器来实现语音功率谱的计算。
作为本发明的进一步改进,在所述步骤4中,运用基于广义伽马的先验概率模型得到最小均方误差语音增强算法。
本发明还提供了一种基于连续噪声跟踪的目标语音信号增强系统,包括:存储器、处理器以及存储在所述存储器上的计算机程序,所述计算机程序配置为由所述处理器调用时实现本发明所述的方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序配置为由处理器调用时实现本发明所述的方法的步骤。
本发明的有益效果是:本发明有效地把目标语音信号分离出来,大大减小了语音信号中的噪声残余量,使得目标信号的质量大大提高。这对自动语音识别、说话人识别、人机对话接口以及助听器等应用有着非常重要的作用。
附图说明
图1是本发明的框架图。
图2(a)是信噪比为-5dB条件下被交通噪声污染的带噪语音时域波形图。
图2(b)是各噪声跟踪方法对快速变化的噪声水平跟踪性能的对比结果图。
图3是语音波形图,其中图(a)是纯净语音图、图(b)是带噪语音图、图(c)是增强后的语音图。
具体实施方式
本发明公开了一种基于连续噪声跟踪的目标语音信号增强方法,能够针对生活中的噪声实现有效的目标源信号与背景噪声的分离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910168105.0/2.html,转载请声明来源钻瓜专利网。