[发明专利]基于非局部均值滤波的语音增强方法有效

专利信息
申请号: 201410227922.6 申请日: 2014-05-27
公开(公告)号: CN103971697B 公开(公告)日: 2016-11-23
发明(设计)人: 钟桦;焦李成;周伟;田小林;王爽;侯彪;王桂婷;马文萍;尚荣华 申请(专利权)人: 西安电子科技大学
主分类号: G10L21/0232 分类号: G10L21/0232
代理公司: 陕西电子工业专利中心 61205 代理人: 王品华;王喜缓
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于非局部均值滤波的语音增强方法,主要解决现有技术在语音增强后易产生音乐噪声的问题。其实现步骤是:(1)输入带噪语音,计算带噪语音信号功率谱;(2)对带噪语音信号功率谱进行修改谱减法预处理,得到带噪语音估计功率谱;(3)由估计功率谱得到估计频谱,再对估计频谱进行短时傅立叶逆变换,得到预处理后语音;(4)对预处理后语音进行非局部均值滤波,计算语音修正值;(5)使用计算出来的修正值替代原始含噪语音信号。本发明为以非局部原理为基础,通过对待增强点邻域内的相似点进行加权平均,既能抑制背景噪声同时保持了语音清晰度,有效提高了语音质量,可用于移动通信。
搜索关键词: 基于 局部 均值 滤波 语音 增强 方法
【主权项】:
一种基于非局部均值滤波的语音增强方法,包括如下步骤:1)采集带噪语音y(i),以每帧256个语音点将带噪语音分为N帧,帧间重叠128个点,并逐帧加汉明窗,通过短时傅里叶变换获得逐帧的频谱Yλ(ω),进而得到带噪语音逐帧功率谱|Yλ(ω)|2,i表示时域信号离散点序列,i=1,2,...,m,m表示语音序号总数目,λ表示帧序列数,λ=1,2,...,N,ω表示离散频率点,ω=1,2,...,256;2)根据带噪语音前n帧功率谱|Yλ(ω)|2,得到噪声估计功率谱|N(w)|2<mrow><msup><mrow><mo>|</mo><mi>N</mi><mrow><mo>(</mo><mi>&omega;</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><mn>1</mn><mo>/</mo><mi>n</mi><munder><mo>&Sigma;</mo><mrow><mi>&lambda;</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mn>...</mn><mo>,</mo><mi>n</mi></mrow></munder><msup><mrow><mo>|</mo><msub><mi>Y</mi><mi>&lambda;</mi></msub><mrow><mo>(</mo><mi>&omega;</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mrow>其中,n表示语音“寂静段”的功率谱帧序列;3)根据噪声估计功率谱|N(w)|2与带噪语音功率谱|Yλ(ω)|2,逐帧计算带噪语音功率谱|Yλ(ω)|2的处理系数Kλ(ω):Kλ(ω)={rλ(ω)|ω=1,2,...,256}其中,rλ(ω)表示单个频率点系数:式中,|d(ω)|2表示噪声功率谱上的离散频率点ω功率,|xλ(ω)|2表示语音功率谱上的离散频率点ω功率;4)根据带噪语音功率谱|Yλ(ω)|2和其处理系数Kλ(ω),得到语音估计功率谱<mrow><msup><mrow><mo>|</mo><msub><mover><mi>Y</mi><mo>^</mo></mover><mi>&lambda;</mi></msub><mrow><mo>(</mo><mi>&omega;</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msub><mi>K</mi><mi>&lambda;</mi></msub><mrow><mo>(</mo><mi>&omega;</mi><mo>)</mo></mrow><msup><mrow><mo>|</mo><msub><mi>Y</mi><mi>&lambda;</mi></msub><mrow><mo>(</mo><mi>&omega;</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>;</mo></mrow>5)根据语音估计功率谱得到语音估计频谱再对语音估计频谱进行短时傅里叶逆变换,得到预处理后的语音信号i=1,2,...,m;6)用非局部均值滤波算法计算出语音信号内所有语音点的修正值再用修正值替代原始值,得到去噪语音信号6a)对于语音点i,以其当前位置为中心,在语音点i的邻域内左右各取f个语音点构成一列向量再在其邻域内左右各取t个语音点构成搜索窗Δ,Δ内各语音点的位置依次用j标记,j=1,2,...,2t+1,对于搜索窗内第j个语音点,以其当前位置为中心,在其邻域内左右各取f个语音点构成另一列向量6b)根据步骤6a)所取的两列向量,将语音点i与其搜索窗内语音点j的相似性权值表示为<mrow><mi>w</mi><mrow><mo>(</mo><msub><mover><mi>x</mi><mo>&RightArrow;</mo></mover><mi>i</mi></msub><mo>,</mo><msub><mover><mi>x</mi><mo>&RightArrow;</mo></mover><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mfrac><mrow><mo>|</mo><mo>|</mo><msub><mover><mi>x</mi><mo>&RightArrow;</mo></mover><mi>i</mi></msub><mo>-</mo><msub><mover><mi>x</mi><mo>&RightArrow;</mo></mover><mi>j</mi></msub><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup></mrow><msup><mi>h</mi><mn>2</mn></msup></mfrac><mo>)</mo></mrow><mo>,</mo></mrow>其中,h表示平滑参数,h=kσ,k=4.2,σ表示由语音开始“寂静段”直接估计出的噪声标准差,表示二阶范数,f=25,t=100;6c)依次计算出语音点i和搜索窗内所有语音点的相似性权值,再对搜索窗内所有点加权平均,得到第i个语音点的修正值<mrow><mover><mi>y</mi><mo>~</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mi>Z</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow></mfrac><munder><mo>&Sigma;</mo><mrow><mi>j</mi><mo>&Subset;</mo><mi>&Delta;</mi></mrow></munder><mi>V</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mi>w</mi><mrow><mo>(</mo><msub><mover><mi>x</mi><mo>&RightArrow;</mo></mover><mi>i</mi></msub><mo>,</mo><msub><mover><mi>x</mi><mo>&RightArrow;</mo></mover><mi>j</mi></msub><mo>)</mo></mrow></mrow>其中,V(j)表示搜索窗内第j个语音点含噪信号值,Z(i)表示权值之和:<mrow><mi>Z</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>=</mo><munder><mo>&Sigma;</mo><mrow><mi>j</mi><mo>&Element;</mo><mi>&Delta;</mi></mrow></munder><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mfrac><mrow><mo>|</mo><mo>|</mo><msub><mover><mi>x</mi><mo>&RightArrow;</mo></mover><mi>i</mi></msub><mo>-</mo><msub><mover><mi>x</mi><mo>&RightArrow;</mo></mover><mi>j</mi></msub><mo>|</mo><msubsup><mo>|</mo><mn>2</mn><mn>2</mn></msubsup></mrow><msup><mi>h</mi><mn>2</mn></msup></mfrac><mo>)</mo></mrow><mo>;</mo></mrow>6d)重复步骤6a)‑6c),依次计算出语音信号内所有语音点的修正值i=1,2,...,m,其中,m表示语音信号总数目。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410227922.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top