[发明专利]基于语音重建的瞬态噪声抑制方法有效

专利信息
申请号: 201410857049.9 申请日: 2014-12-29
公开(公告)号: CN104599677B 公开(公告)日: 2018-03-09
发明(设计)人: 厉剑;郑成诗;李晓东;杨鹤飞 申请(专利权)人: 中国科学院上海高等研究院;中国科学院声学研究所
主分类号: G10L21/0308 分类号: G10L21/0308
代理公司: 上海申汇专利代理有限公司31001 代理人: 林炜
地址: 201210 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语音 重建 瞬态 噪声 抑制 方法
【说明书】:

技术领域

发明涉及音频处理技术,特别是涉及一种基于语音重建的瞬态噪声抑制方法的技术。

背景技术

在手机、助听器、免提电话等语音通讯终端设备中,瞬态噪声如键盘声、鼠标声以及敲击声等会严重影响语音质量和音频品质,因此必须进行相应的检测和抑制。瞬态噪声是一种加性噪声,属于强非平稳态噪声,典型的瞬态噪声是一段突发脉冲式的信号,并伴随持续时间10-50ms的衰减振荡过程,由于其频带较宽,与语音信号在时频域有较多重叠,且具有非连续性的特点,因此传统的单通道和多通道语音增强方法都不能很好地抑制瞬态噪声,还可能引入失真。

近年来,国内外研究者提出了一些用于瞬态噪声抑制的方法,Talmon等提出了一类瞬态噪声抑制方法,通过采用非局部(Non-local,NL)扩散滤波器和最优改进对数谱幅度估计算法(Optimally-Modified-Log Spectral-Amplitude,OM-LSA)。Zheng等在时域、频率域和小波域等提出了一些基于变化域的瞬态噪声检测及抑制方法。这些方法主要通过学习瞬态噪声的特性,以实现瞬态噪声的检测,最终实现瞬态噪声的抑制。但是此类方法存在时延和噪声残留,并且只适用于部分类型的瞬态噪声,因此在实时语音通信系统应用中不具普遍适用性,而且由于人耳的听觉特性,对残留的瞬态噪声异常敏感,现有的方法都无法完全地消除瞬态噪声。

发明内容

针对上述现有技术中存在的缺陷,本发明所要解决的技术问题是提供一种能有效地抑制瞬态噪声,在语音信号和瞬态噪声同时存在时能完全地消除瞬态噪声的基于语音重建的瞬态噪声抑制方法。

为了解决上述技术问题,本发明所提供的一种基于语音重建的瞬态噪声抑制方法,其特征在于,具体步骤如下:

1)利用传声器拾取声信号,并对传声器所拾取的声信号进行预处理,忽略其中的平稳态噪声残留ds(n),得到预处理后的声信号为:

x(n)=s(n)+dt(n);

其中,x(n)为预处理后的声信号,s(n)为预处理后的声信号中的目标语音成分,dt(n)为预处理后的声信号中的瞬态噪声成分;

2)对x(n)进行分帧、预白化处理,基于预白化后浊音和瞬态噪声的波形分布特性差异,对x(n)逐帧检测是否含有瞬态噪声;

3)对x(n)进行重建,瞬态噪声与语音信号同时存在时,将x(n)中包含有瞬态噪声的帧丢弃,或将x(n)中包含有瞬态噪声的帧及其后的2-3帧一并舍弃,再利用去除帧的前后相邻的未受干扰帧进行波形重建,替换掉原有的信号。

进一步的,所述步骤2)中,对x(n)逐帧检测是否含有瞬态噪声的步骤如下:

2.1)对x(n)进行分帧、预白化处理,得到x(n)的白化信号,将x(n)的白化信号中的各帧信号记为:

其中,为x(n)的白化信号中的第l帧信号的第k个样本点,x(k,l)为原始信号进行分帧处理后的第l帧信号的第k个样本点,P为线性预测的阶数,为第l帧信号的线性预测系数,x(k-p,l)为原始信号进行分帧处理后的第l帧信号的第k-p个样本点;

2.2)加入窗函数计算x(n)的白化信号各帧的重心,具体计算公式为:

其中,C(l)为x(n)的白化信号第l帧的重心,w(k)为汉宁窗,N为x(n)的白化信号中每帧的采样点数量;

2.3)以C(l)为中心,计算包含E%能量所需的时间长度B(l),具体计算公式为:

其中,是指取能使成立的v的最小取值,E%=90%;

2.4)根据B(l)值判断信号中是否存在瞬态噪声,如果B(l)<thr,则判定信号中存在瞬态噪声,thr为预先设定的瞬态噪声判断门限。

进一步的,所述步骤2.2)中,N=512。

进一步的,所述步骤2.4)中,thr=150。

进一步的,所述步骤3)中,对x(n)进行重建的步骤如下:

3.1)利用基音周期检测方法对丢弃帧之前的封包进行基音周期检测,得到的前向基音周期Pf,对丢弃帧之后的封包进行基音周期检测,得到后向基音周期Pb,并确定丢弃帧前一封包的周期波形及后一封包的周期波形;

对于x(n)中的丢弃帧,对这些丢弃帧之前的封包与之后的封包进行基音检测,并判断是否为浊音,如果前后帧都是浊音,则转至步骤3.2),反之则转至步骤3.3);

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海高等研究院;中国科学院声学研究所,未经中国科学院上海高等研究院;中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410857049.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top