[发明专利]基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质有效
申请号: | 201910168105.0 | 申请日: | 2019-03-06 |
公开(公告)号: | CN109817234B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 张啟权;王明江;陆云;韩宇菲;张禄;孙凤娇 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0272;G10L25/03;G10L25/45 |
代理公司: | 深圳市添源知识产权代理事务所(普通合伙) 44451 | 代理人: | 罗志伟 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 连续 噪声 跟踪 目标 语音 信号 增强 方法 系统 存储 介质 | ||
1.一种基于连续噪声跟踪的目标语音信号增强方法,其特征在于,包括如下步骤:
步骤1:接收带噪语音信号,对带噪语音信号进行分帧加窗处理,然后使用短时傅里叶变换得到时频域的关系;
步骤2:对噪声功率谱进行估计;
步骤3:纯净语音功率谱的估计;
步骤4:通过语音估计器对纯净语音信号进行估计,对于语音估计器的先验信噪比,利用判决引导算法估计器来实现;
步骤5:反傅里叶变换,加窗并使用交叠相加技术实现纯净语音恢复;
在所述步骤2中,使用噪声功率的最小均方误差估计器来对噪声功率谱进行估计;
在所述步骤2中,利用贝叶斯准则,能得到最小均方误差估计器,式子如下
在公式(1)中,n(N)代表噪声谱变量,θ代表噪声短时傅里叶变换系数的角度,N和n分别表示变量噪声谱幅度及其取值,Y代表带噪语音的短时傅里叶变换系数,E{·}代表取期望算子,d没有含义,d只是积分公式里的通用表达方式;
由于纯净语音与噪声的傅里叶系数被假定为服从高斯分布的,得到
在公式(2)中,n(N)代表噪声谱变量,λd代表噪声功率谱密度,其中λx代表语音功率谱密度,R代表带噪语音谱的幅度,I0(·)代表零阶修正的第一类贝塞尔函数;
通过推导我们得到
其中ξ=λx/λd和γ=R2/λd分别代表先验信噪比和后验信噪比,R=|Y(l,k)|是带噪语音短时傅里叶变换系数的幅度;
在所述步骤3中,使用基于语音存在概率的最小均方误差估计器来实现纯净语音功率谱的计算;
在所述步骤4中,运用基于广义伽马的先验概率模型得到最小均方误差语音增强算法;
先验的广义伽马概率模型为
参数μ=1和ν=6;
在公式(8)中,a代表的变量是是语音谱幅度,Γ(·)表示伽马函数,其他参数均为伽马模型的形状参数。
2.一种基于连续噪声跟踪的目标语音信号增强系统,其特征在于,包括:存储器、处理器以及存储在所述存储器上的计算机程序,所述计算机程序配置为由所述处理器调用时实现权利要求1所述的方法的步骤。
3.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机程序,所述计算机程序配置为由处理器调用时实现权利要求1所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910168105.0/1.html,转载请声明来源钻瓜专利网。