[发明专利]基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法有效

专利信息
申请号: 201210428465.8 申请日: 2012-10-30
公开(公告)号: CN102915742A 公开(公告)日: 2013-02-06
发明(设计)人: 张雄伟;黄建军;吴海佳;贾冲;曾理;周彬 申请(专利权)人: 中国人民解放军理工大学
主分类号: G10L21/0224 分类号: G10L21/0224;G10L21/0272;G10L25/45
代理公司: 南京理工大学专利中心 32203 代理人: 唐代盛
地址: 210007 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 稀疏 矩阵 分解 通道 监督 分离 方法
【说明书】:

技术领域

发明属于语音信号处理技术领域,是关于一种语音噪声分离方法,特别是基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法。

背景技术

语噪分离(Speech and noise separation)就是为了实现在复杂噪声环境中分离出目标说话人语音而对带噪语音所做的处理,其中主要目标就是消除环境噪声对语音的干扰,提高语音质量。语噪分离可以说是语音增强(Speech Enhancement)算法的一种扩展,其处理的噪声甚至可以包括其他说话人语音。

在上个世纪,由于计算机计算能力限制,人们的目光主要集中在算法复杂度较低且实现简便的单通道语音增强或语音去噪(Speech denoising)算法中。在这一类算法中典型的有如谱减法(Spectral Subtraction)、维纳滤波法(Wiener Filter)、基于短时幅度谱的最小均方误差估计方法(minimum mean square error approach for short time spectral amplitude estimation)、信号子空间法(Signal Subspace)、小波去噪法(Wavelet Denoise)。这类算能够在一定程度上消除部分噪声,但在现实环境中的消噪效果往往并不理想。在现实环境下的噪声抑制仍然是一项富有挑战的课题,特别地,在低信噪比和受多种类型噪声污染的情况下,语音消噪效果往往难于满足实际应用需求。

随着计算机能力的飞速提高,许多学者提出了基于盲源分离思想的语噪分离算法以进一步抑制噪声,典型的有:(1)非负稀疏编码(Non-negative Sparse Coding,NNSC)。利用非负稀疏编码(NNSC)构造噪声字典并在固定噪声字典的情况下更新语音字典,最后联合语音字典和其对应的投影系数重构出语音幅度谱,去除噪声干扰。(Mikkel N.Schmidt,Jan Larsen and Fu-Tien Hsiao.Wind noise reduction using non-negative sparse coding.IEEE Workshop on Machine Learning for Signal Processing,2007;431-436.)(2)非负矩阵分解(Non-negative Matrix Factorization,NMF)方法。基于NMF算法,通过训练构造语音和噪声的字典,并将其组合成一个联合字典,利用非负矩阵分解更新带噪语音在联合字典下的投影系数,实现语音去噪。(K.Wilson,B.Raj,P.Smaragdis,and A.Divakaran.Speech denoising using nonnegative matrix factorization with priors.ICASSP,2008;4029-4032.)。但是该方法需要依赖于说话人特征,在实际语音通信系统中难以应用。(3)K-SVD方法。Christian D.Sigg在离线的情况下运用K-SVD算法训练语音字典,在语音停顿的时刻在线学习噪声字典的,然后构造一个由语音字典和噪声字典组合而成的合成字典,通过对带噪语音在合成字典下的稀疏编码得到语音信号的估计,从而实现语音与噪声的分离。(Christian D.Sigg,Tomas Dikk and Joachim M.Buhmann,Speech enhancement with sparse coding in learned dictionaries.ICASSP,2010;4758-4761.)。采用盲源分离的思想实现语音去噪的一个显著优势就是这类算法对噪声能量不敏感,特别适合于极低信噪比条件下的语音去噪。然而,由于目前的语噪分离算法大都依赖于先验知识,即需要事先对语音或噪声数据进行训练,这一特点限制了这些算法在实际场合的应用。

发明内容

本发明的目的在于提供了一种基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法,在不需要噪声先验知识的前提下提升了语噪分离系统的性能,改善了分离后语音的质量。

实现本发明目的的技术解决方案为:一种基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法,从带噪语音中直接分离出纯净语音,包括如下步骤:

(1)利用短时傅里叶变换将带噪语音时域波形y(n)变换到时频域,得到带噪语音的幅度谱M;

(2)利用低秩与稀疏矩阵分解算法对带噪语音的幅度谱M进行分解,获得噪声的幅度谱L、语音的幅度谱S和残余噪声的幅度谱R,分解为如下形式:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军理工大学,未经中国人民解放军理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210428465.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top