[发明专利]基于约束低秩与稀疏分解的子空间语音增强方法在审

申请号：	201810695775.3	申请日：	2018-06-29
公开（公告）号：	CN108899045A	公开（公告）日：	2018-11-27
发明（设计）人：	庄迁政;李晓东;原帅;王文豪;胡墨;裘旭益;岳新启;孙成立	申请（专利权）人：	中国航空无线电电子研究所
主分类号：	G10L21/0224	分类号：	G10L21/0224;G10L21/0272
代理公司：	上海和跃知识产权代理事务所(普通合伙) 31239	代理人：	杨慧
地址：	200233 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	低秩语音增强子空间低秩矩阵稀疏分解稀疏矩阵噪声环境有效秩语音对角线矩阵分解合成分析法纯净语音迭代重复平均运算实时处理输出语音增强信号逐帧处理非稳态构造带迭代分帧可用时域稳态噪声应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于约束低秩与稀疏分解的子空间语音增强方法，包括如下步骤：(1)对含噪语音进行分帧；(2)对每一帧含噪语音，在时域上构造带噪矩阵Y；(3)对Y进行SVD分解，根据SVD分解结果，利用合成分析法来确定纯净语音的有效秩P；(4)对Y进行低秩和稀疏矩阵分解，得到低秩矩阵L；(5)对得到的L的对角线进行平均运算，从中提取增强信号；(6)对每一帧迭代重复上面的步骤，达到迭代次数后输出语音信号。本发明具备了子空间方法和低秩和稀疏矩阵分解的优点：可以在线逐帧处理数据，因而可用于实时处理的语音增强任务；可以根据噪声环境自动估计低秩矩阵的有效秩；可以应用于任意的噪声环境，包括稳态和非稳态噪声。

技术领域

本发明涉及于语音信号处理技术领域，是一种对含噪语音进行降噪的方法，特别是基于约束低秩与稀疏分解的子空间语音降噪方法。

背景技术

语音是最有效、最常用和最方便的交流手段之一。近些年，随着信息科学技术的不断向前发展，语音更是成为人机交互的重要手段。智能语音处理技术在许多领域有着广泛的应用前景。但在实际环境中，语音信号总要伴随不同程度的噪声干扰。甚至当干扰严重时，语音信号会完全淹没于噪声中，造成听觉质量的严重下降。语音增强是解决噪声污染的有效技术。语音增强通过抑制噪声对语音的干扰，使得增强处理的语音信号同原始纯净语音信号之间的失真最小。过去几十年来，涌现了各种各样的语音增强算法。目前典型的三大类算法(P.C.Loizou,Speech Enhancement:Theory and Practice.New York:Taylor&Francis,2007)包括谱减法、基于谱幅度最小均方误差、子空间法。其中，子空间方法由于其良好的降噪性能受到广泛的关注，是目前语音降噪的主流方法。

子空间方法的工作原理如下：纯净语音可以被视为含噪语音欧式(Euclidean)空间中的一个子空间。因而，可以寻求一种方法，把含噪语音向量空间分解为一个纯净语音主导的子空间(简称信号子空间)和噪声信号主导的子空间(简称噪声子空间)，通过将噪声子空间置零，同时去除信号子空间中的噪声成分，从而获得纯净语音的估计值。在子空间方法中，如何将含噪语音进行有效的子空间划分，是其中的最核心问题。目前，将含噪语音进行子空间分解，广泛采用线性代数中大家熟知的正交矩阵分解技术，典型的算法包括奇异值分解(singular value hard，SVD)或特征值分解(eigenvalue decomposition,ED)。这两种分解的目的都是求取含噪语音的低秩矩阵，即信号子空间。在基于SVD的子空间算法步骤中，首先将带噪语音信号排列成一个Hankel(或Toeplitz)矩阵。由于纯净语音信号在时域是比较平缓的，可以理解为纯净语音信号排列构成的Hankel(或Toeplitz)矩阵是一个秩值较低的低秩矩阵，因此可用SVD分解获得低秩矩阵。当低秩矩阵的秩近似等于纯净语音的秩时，原矩阵的低秩化近似隐含地忽略了信号子空间的最后消去的列所张成的正交子空间，从而得到增强的语音信号。然而,当数据出现大噪声或离群异常值时，SVD的分解性能将严重下降，少数的异常值就可以带来较大的分解误差。因此，在强噪声条件下，采用传统分解方法(例如SVD和ED分解)获得的低秩矩阵误差很大，从而导致现有子空间方法在低信噪比环境下的工作性能差，语音降噪性能严重下降。

RPCA(Robust Principal Component Analysis)是美国加州理工学院的E.Candes教授和UIUC大学的J.Wright共同提出了一种新的数据分解方法(E.J.Candes,et al.,Robust Principal Component Analysis,Journal of the ACM,vol.58,pp.1-37,2011.)，该方法可以在出现大噪声或离群异常值时，通过对观测数据的进行低秩与稀疏矩阵分解(low-rank and sparse matrix decomposition，简称LS分解)，从强噪声或异常值中有效地分离出原始低秩矩阵。RPCA目前已经应用于多个研究领域，包括监控的视频目标与背景分离、图像阴影去除、文档检索、歌曲中的伴奏音与语音分离。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国航空无线电电子研究所，未经中国航空无线电电子研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810695775.3/2.html，转载请声明来源钻瓜专利网。

上一篇：语音信号处理方法及装置
下一篇：一种基于多级支持向量机分类的语音情感识别方法及系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于约束低秩与稀疏分解的子空间语音增强方法在审

专利文献下载