[发明专利]基于约束低秩与稀疏分解的子空间语音增强方法在审

专利信息
申请号: 201810695775.3 申请日: 2018-06-29
公开(公告)号: CN108899045A 公开(公告)日: 2018-11-27
发明(设计)人: 庄迁政;李晓东;原帅;王文豪;胡墨;裘旭益;岳新启;孙成立 申请(专利权)人: 中国航空无线电电子研究所
主分类号: G10L21/0224 分类号: G10L21/0224;G10L21/0272
代理公司: 上海和跃知识产权代理事务所(普通合伙) 31239 代理人: 杨慧
地址: 200233 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 低秩 语音增强 子空间 低秩矩阵 稀疏分解 稀疏矩阵 噪声环境 有效秩 语音 对角线 矩阵 分解 合成分析法 纯净语音 迭代重复 平均运算 实时处理 输出语音 增强信号 逐帧处理 非稳态 构造带 迭代 分帧 可用 时域 稳态 噪声 应用
【说明书】:

发明公开了一种基于约束低秩与稀疏分解的子空间语音增强方法,包括如下步骤:(1)对含噪语音进行分帧;(2)对每一帧含噪语音,在时域上构造带噪矩阵Y;(3)对Y进行SVD分解,根据SVD分解结果,利用合成分析法来确定纯净语音的有效秩P;(4)对Y进行低秩和稀疏矩阵分解,得到低秩矩阵L;(5)对得到的L的对角线进行平均运算,从中提取增强信号;(6)对每一帧迭代重复上面的步骤,达到迭代次数后输出语音信号。本发明具备了子空间方法和低秩和稀疏矩阵分解的优点:可以在线逐帧处理数据,因而可用于实时处理的语音增强任务;可以根据噪声环境自动估计低秩矩阵的有效秩;可以应用于任意的噪声环境,包括稳态和非稳态噪声。

技术领域

本发明涉及于语音信号处理技术领域,是一种对含噪语音进行降噪的方法,特别是基于约束低秩与稀疏分解的子空间语音降噪方法。

背景技术

语音是最有效、最常用和最方便的交流手段之一。近些年,随着信息科学技术的不断向前发展,语音更是成为人机交互的重要手段。智能语音处理技术在许多领域有着广泛的应用前景。但在实际环境中,语音信号总要伴随不同程度的噪声干扰。甚至当干扰严重时,语音信号会完全淹没于噪声中,造成听觉质量的严重下降。语音增强是解决噪声污染的有效技术。语音增强通过抑制噪声对语音的干扰,使得增强处理的语音信号同原始纯净语音信号之间的失真最小。过去几十年来,涌现了各种各样的语音增强算法。目前典型的三大类算法(P.C.Loizou,Speech Enhancement:Theory and Practice.New York:Taylor&Francis,2007)包括谱减法、基于谱幅度最小均方误差、子空间法。其中,子空间方法由于其良好的降噪性能受到广泛的关注,是目前语音降噪的主流方法。

子空间方法的工作原理如下:纯净语音可以被视为含噪语音欧式(Euclidean)空间中的一个子空间。因而,可以寻求一种方法,把含噪语音向量空间分解为一个纯净语音主导的子空间(简称信号子空间)和噪声信号主导的子空间(简称噪声子空间),通过将噪声子空间置零,同时去除信号子空间中的噪声成分,从而获得纯净语音的估计值。在子空间方法中,如何将含噪语音进行有效的子空间划分,是其中的最核心问题。目前,将含噪语音进行子空间分解,广泛采用线性代数中大家熟知的正交矩阵分解技术,典型的算法包括奇异值分解(singular value hard,SVD)或特征值分解(eigenvalue decomposition,ED)。这两种分解的目的都是求取含噪语音的低秩矩阵,即信号子空间。在基于SVD的子空间算法步骤中,首先将带噪语音信号排列成一个Hankel(或Toeplitz)矩阵。由于纯净语音信号在时域是比较平缓的,可以理解为纯净语音信号排列构成的Hankel(或Toeplitz)矩阵是一个秩值较低的低秩矩阵,因此可用SVD分解获得低秩矩阵。当低秩矩阵的秩近似等于纯净语音的秩时,原矩阵的低秩化近似隐含地忽略了信号子空间的最后消去的列所张成的正交子空间,从而得到增强的语音信号。然而,当数据出现大噪声或离群异常值时,SVD的分解性能将严重下降,少数的异常值就可以带来较大的分解误差。因此,在强噪声条件下,采用传统分解方法(例如SVD和ED分解)获得的低秩矩阵误差很大,从而导致现有子空间方法在低信噪比环境下的工作性能差,语音降噪性能严重下降。

RPCA(Robust Principal Component Analysis)是美国加州理工学院的E.Candes教授和UIUC大学的J.Wright共同提出了一种新的数据分解方法(E.J.Candes,et al.,Robust Principal Component Analysis,Journal of the ACM,vol.58,pp.1-37,2011.),该方法可以在出现大噪声或离群异常值时,通过对观测数据的进行低秩与稀疏矩阵分解(low-rank and sparse matrix decomposition,简称LS分解),从强噪声或异常值中有效地分离出原始低秩矩阵。RPCA目前已经应用于多个研究领域,包括监控的视频目标与背景分离、图像阴影去除、文档检索、歌曲中的伴奏音与语音分离。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空无线电电子研究所,未经中国航空无线电电子研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810695775.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top