[发明专利]一种基于谱估计的瞬态噪声抑制方法有效

申请号：	201310383122.9	申请日：	2013-08-28
公开（公告）号：	CN103456310B	公开（公告）日：	2017-02-22
发明（设计）人：	陈喆;殷福亮;张兆伟	申请（专利权）人：	大连理工大学
主分类号：	G10L21/0216	分类号：	G10L21/0216
代理公司：	大连东方专利代理有限责任公司21212	代理人：	曲永祚,李洪福
地址：	116024 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于谱估计的瞬态噪声抑制方法，属于数字信号处理技术领域。本发明包括以下几步第一步基于改进的最小控制递归平滑的非瞬态背景噪声功率谱估计第二步基于改进最小控制递归平滑和最优修正对数谱幅度估计的瞬态噪声功率谱估计第三步基于最优修正对数谱幅度估计及瞬态噪声谱估计的语音噪声抑制。
搜索关键词：	一种基于估计瞬态噪声抑制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于谱估计的瞬态噪声抑制方法，其特征在于：包括以下几步：第一步：基于改进的最小控制递归平滑的非瞬态背景噪声功率谱估计；第二步：基于改进最小控制递归平滑和最优修正对数谱幅度估计的瞬态噪声功率谱估计；第三步：基于非瞬态背景噪声功率谱估计、最优修正对数谱幅度估计及瞬态噪声谱估计的语音噪声功率谱抑制；基于改进的最小控制递归平滑的非瞬态背景噪声谱估计步骤如下：(1)定义纯净语音信号为x(n)，加性噪声为d(n)，观测信号为y(n)，y(n)＝x(n)+d(n)，对观测信号y(n)进行加窗分帧操作，并进行短时傅立叶变换：其中，n为时域索引，n＝0,1,…，N‑1，k为频率索引，k＝0,1,…，N‑1，l为时域帧的索引，h(n)为窗函数，N为帧长，256≤N≤2048，也是窗口宽度，M为帧移，0.25N≤M≤0.75N；(2)短时功率谱平滑对于不存在语音的观测信号帧，用短时递归平滑法来平滑时变噪声功率谱其中，H0(k,l)和H1(k,l)分别表示无音和有音两种状态，αd为平滑参数，αd的取值范围是0<αd<1；设条件语音存在概率为p'(k,l)＝P(H1(k,l)|Y(k,l)),则非瞬态背景噪声功率谱估计为：其中，是个时变的平滑的参数，其定义式为：因此，通过平滑当前帧以前的功率谱值获得噪声的功率谱估计，而平滑参数由条件语音存在概率p'(k,l)控制；(3)条件语音存在概率计算最小控制递归平滑方法基于噪声信号能量的局部统计来追踪条件语音存在概率，通过计算当前帧各频点能量与该频点的局部最小值之间的比值，进行有音/无音判决；①通过对短时傅立叶变换幅值的平方加窗来平滑带噪语音信号的功率谱；式中，b(i)为长为2w+1的窗函数；②通过一阶递归平均来进一步平滑功率谱；S(k,l)＝αsS(k,l‑1)+(1‑αs)Sf(k,l)，其中，αs为平滑参数，αs的取值范围是0<αs<1；当前能量的最小值Smin(k,l)通过后向最小值搜索得到，具体如下：Smin(k,l)＝min{S(k,l),S(k,l‑1),...,S(k,l‑L+1)}，其中，min{·}表示搜索最小值，L为后向局部搜索窗的长度，针对于不同的说话人及说话环境，该搜索窗的效时间长度为0.5～1.5秒；③条件语音存在概率估计定义为含噪信号局部能量与其最小值的比值；则通过与经验阈值δ的比较进行有音/无音判决：当Sr(k,l)>δ时，标记当前频点为有音；否则，当Sr(k,l)<δ时，标记当前频点为无音；定义I(k,l)为语音存在指示器；则条件语音存在概率的估计为：其中，αp为平滑参数，αp的取值范围是0<αp<1；将估计的代入式(23)，计算时变平滑参数进而能估计非瞬态背景噪声功率谱基于改进最小控制递归平滑和最优修正对数谱幅度估计的瞬态噪声功率谱估计如下：(1)相对于瞬态噪声，语音信号和背景噪声的功率谱变化较慢，在该步骤中将瞬态噪声视为信号，而将语音和背景噪声非瞬态成分视为噪声，对最小控制递归平滑方法进行改进，通过计算瞬态噪声出现概率来控制非瞬态成分功率谱的递归平滑，使其能够估计观测信号中非瞬态成分的时变功率谱；首先，通过对频谱幅度的平方|Y(k,l)|2进行一阶递归平均，得到平滑后的功率谱；S(k,l)＝αsS(k,l‑1)+(1‑αs)|Y(k,l)|2，其中，αs为用于控制对功率谱快速追踪的平滑参数，αs越小，当前帧的权重越大，则能够捕获语音或者背景噪声的快速变化，αs取值范围是0.65<αs<0.95；瞬态噪声出现概率由平滑后功率谱的局部最小值控制，采用最小控制递归平滑方法，使用局部因果窗来前向搜索最小功率值，能够检测出大部分语音和背景噪声部分；但是，语音音素的起音点处同样具有突发性，如果只采用前向搜索窗计算最小功率值，语音起音点将被错误地判断为瞬态信号，造成后续语音噪声抑制的失真；这里，将未来的时间帧考虑在内，来分辨瞬态噪声和语音起音点，因为瞬态噪声由一个强脉冲和一段短时衰减振荡组成，因此瞬态噪声的能量会迅速衰减，而起音点之后的语音能量在该音素内会保持平稳，因此，在搜索最小功率值时，同时采用了前向因果窗和后向非因果窗进行搜索，具体如下：其中，min{·}表示搜索最小值，max{·}表示搜索最大值，L和T分别为前向因果窗和后向非因果窗的长度；该搜索方法避免了语音音素起音点的误判问题；然后，用与最小控制递归平滑中条件语音存在概率估计相同的方法，估计瞬态噪声出现概率，根据瞬态噪声出现概率估计值计算用于非瞬态成分功率谱平滑的时变参数并利用式(34)递归地估计语音及背景噪声的功率谱(2)瞬态噪声谱估计将瞬态噪声作为要进行增强的信号，首先估计的非瞬态成分功率谱作为噪声的功率谱，用于计算瞬态噪声的后验信噪比γt；令Gf(k,l)为估计瞬态噪声功率谱的最优频谱增益，则根据式该最优频谱增益为：式中，vt(k,l)＝γt(k,l)ξt(k,l)/[1+ξt(k,l)]，Gmin为瞬态噪声不存在时的频谱增益，ξt(k,l)表示瞬态噪声的先验信噪比，其估计方法如下：其中，为有音段的状态增益函数，αt为权重因子，αt的取值范围是0<αt<1，用来控制非瞬态成分消除与瞬态噪声失真之间的取舍；最终通过最优频谱增益估计值Gf(k,l)与含噪语音幅度谱的平方相乘，得到增强后的瞬态信号功率谱估计在这一过程中，将瞬态噪声视为信号，而将语音和其他背景噪声视为噪声，利用瞬态噪声的突变性，实现对非瞬态成分功率谱的平滑与跟踪；再利用最优修正对数谱幅度估计方法计算瞬态噪声的功率谱估计。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于大连理工大学，未经大连理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310383122.9/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于谱估计的瞬态噪声抑制方法有效

专利文献下载