[发明专利]基于非局部均值滤波的语音增强方法有效

申请号：	201410227922.6	申请日：	2014-05-27
公开（公告）号：	CN103971697B	公开（公告）日：	2016-11-23
发明（设计）人：	钟桦;焦李成;周伟;田小林;王爽;侯彪;王桂婷;马文萍;尚荣华	申请（专利权）人：	西安电子科技大学
主分类号：	G10L21/0232	分类号：	G10L21/0232
代理公司：	陕西电子工业专利中心 61205	代理人：	王品华;王喜缓
地址：	710071***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于局部均值滤波语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于语音处理技术领域，具体地说是基于非局部均值滤波，利用信号邻域内相似信号点加权平均来降低语音噪声，可用于移动通信。

背景技术

语音是人类特有的功能，也是相互传递信息的最主要手段。现实生活中的语音不可避免的要受到周围环境的影响。一些较强的背景噪声，如机械噪声、其他说话者的语音等均会严重的影响语音信号的质量。此外，传输系统本身也会产生各种噪声，因此在接收端的信号为带噪语音信号。语音增强的主要目标就是在接收端尽可能从带噪语音中提取纯净的语音信号，降低听众的听觉疲劳程度，提高可懂度。

语音增强是语音信号处理的一个重要分支，一直活跃的研究领域。人们对语音增强的研究已有一个世纪的历史。早在上个世纪初，Bell实验室的研究人员就对电话系统的音节清晰度进行了系统的实验。七十年代后期，电子计算机技术的进步促进了语音信号处理技术的迅速发展。谱减法是这个时期最具影响的语音增强算法。在八十年代至今，语音识别与移动通信技术的飞速发展为语音增强的研究提供了动力，各种新算法以及原有算法的改进形式相继问世。如基于信号子带空间的语音增强算法；利用人工神经网络实现语音增强的方法；基于小波分解的滤波方法；最小均方误差滤波MMSE；对数谱最小均方误差估计LSA-MMSE等。

语音信号是一个非平稳信号，但在10-30ms一段时间内可以认为人的声带、声道等特征基本不变，语音的短时谱具有相对的稳定性和较强的相关性，而噪声的前后相关性很弱，所以可以利用短时谱这种特性进行语音增强，由于人耳对相位的信息不敏感，仅考虑幅度的估计即可。因此，基于短时谱幅度估计shorttimespectralamplitude的语音增强算法，是现在人们研究较多的一种语音增强技术。

上述传统的语音增强方法，由于需要得到准确的噪声功率谱和先验信噪比，而现实中噪声功率谱和先验信噪比的准确估计是难以实现的，因而导致语音增强后背景易残留噪声，影响听觉质量。

发明内容

本发明的目的在于针对上述已有技术的问题，提出一种基于非局部的语音增强方法，以有效避免对噪声功率谱和先验信噪比准确估计的过分依赖，减少语音背景中平稳或非平稳噪声，提高语音清晰度。

为实现上述目的，本发明包括如下步骤：

1)采集带噪语音y(i)，以每帧256个语音点将带噪语音分为N帧，帧间重叠128个点，并逐帧加汉明窗，通过短时傅里叶变换获得逐帧的频谱Y_λ(ω)，进而得到带噪语音逐帧功率谱|Y_λ(ω)|²，i表示时域信号离散点序列，i＝1,2,...,m，m表示语音序号总数目，λ表示帧序列数，λ＝1,2,...,N，ω表示离散频率点,ω＝1,2,...,256；

2)根据带噪语音前n帧功率谱|Y_λ(ω)|²，得到噪声估计功率谱|N(w)|²：

|N(ω)|2=1/nΣλ=1,2,...,n|Yλ(ω)|2]]>

其中，n表示语音“寂静段”的功率谱帧序列；

3)根据噪声估计功率谱|N(w)|²与带噪语音功率谱|Y_λ(ω)|²，逐帧计算带噪语音功率谱|Y_λ(ω)|²的处理系数K_λ(ω)：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安电子科技大学，未经西安电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410227922.6/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于非局部均值滤波的语音增强方法有效

专利文献下载