[发明专利]用于确定深度过滤器的方法和装置在审
申请号: | 202080043612.2 | 申请日: | 2020-04-15 |
公开(公告)号: | CN114041185A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 伊曼纽尔·哈贝茨;沃尔夫冈·马克 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋融冰 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 确定 深度 过滤器 方法 装置 | ||
一种用于确定深度过滤器的方法,包括以下步骤:·接收混合物;·使用深度神经网络估计深度过滤器,其中执行估计,使得深度过滤器在应用于混合物的元素时,获得期望表示的各元素的估计;其中具有至少一个维度的深度过滤器包括具有元素的张量。
技术领域
本发明实施例涉及一种确定深度过滤器的方法和装置。进一步的实施例涉及用于信号提取、信号分离或信号重构的方法的使用。
背景技术
当由传感器捕获信号时,它通常包含期望和不期望组件。考虑在具有额外干扰扬声器或定向噪声源(不期望)的嘈杂环境中的语音(期望)。从混合物中提取期望语音以获得高质量的无噪声录音,并且可以有利于感知语音质量,例如在电话会议系统或移动通信中。考虑到由传感器捕获生物医学信号的心电图、肌电图或脑电图中的不同场景,还必须消除干扰或噪声以实现对捕获信号的最佳解释和进一步处理,例如由医生进行。一般而言,在多种不同场景中,从混合物中提取期望信号或在混合物中分离多个期望信号是可取的。
除了提取和分离之外,还存在无法再访问部分捕获信号的场景。考虑到一些包裹丢失的传输场景或室内声学导致空间梳状过滤器并导致特定频率取消/破坏的音频录音。假设信号的剩余部分中有关于丢失部分内容的信息,那么在多种不同场景中重构丢失的信号部分也是非常可取的。
下面将讨论当前的信号提取和分离方法:
给定对期望和不期望信号统计的充分估计,传统方法,如维纳过滤,将实值增益应用于复杂的混合短时傅立叶变换(STFT)表示,以从混合中提取期望信号[例如[01]、[02]]。
另一种可能性是从统计中估计每个混合时频位格(bin)的STFT域中的复值多维过滤器,并将其应用于执行提取。对于分离场景,每个期望信号都需要自己的过滤器[02]。
基于统计的方法在给定稳定信号的情况下表现良好,然而,给定高度非稳定信号,统计估计通常具有挑战性。
另一种方法是使用非负矩阵分解(NMF)。它以无监督的方式从数据的提供的训练数据基础向量中学习,这些数据可以在测试过程中被识别[例如[03]、[04]]。鉴于语音必须与白噪声分离,NMF学习训练示例中最突出的基础向量。由于白噪声在时间上不相关,因此这些向量属于语音。在测试期间,可以确定基础向量之一当前是否处于活跃状态以执行提取。
来自不同扬声器的语音信号非常不同,通过有限数量的基础向量来接近所有可能的语音信号并不能满足期望数据的这种高方差。此外,如果噪声在训练期间高度不稳定且未知,不像白噪声,基础向量可能会覆盖噪声段,这会降低提取性能。
近年来,尤其是基于深度学习的时频掩膜技术在性能方面表现出重大改进[例如[05]]。给定标记的训练数据,训练深度神经网络(DNN)来估计时频掩膜。此掩膜按元素应用于复杂混合物STFT以执行信号提取或在多个掩膜信号分离的情况下。给定混合时频位格仅由单个源支配的情况下,掩膜元素可以是二进制的[例如[06]]。掩膜元素也可以是实值比率[例如[07]]或复值比率[例如[08]]给定每个时频位格的多个活跃源。
此提取由图1示出。图1示出了多个位格sx,y的两个频率/时间图。这些位格是输入STFT,其中由输入STFT的A标记的区域被提供给DNN,以估计其中每个时间频率位格的增益。此增益以元素方式应用于复数输入STFT(参见输入和提取图内由x标记的位格)。这样做的目的是估计相应的期望分量。
由于期望信号和非期望信号的破坏性干扰,给定混合时频位格为零,掩模无法通过仅向此位格应用增益来重构期望信号,因为相应的掩膜值不存在。即使由于期望信号和非期望信号的破坏性干扰,混合时频位格接近于零,掩膜通常也无法通过仅向此位格施加增益来完全重构期望信号,因为考虑到特定时频位格中的破坏性干扰,相应掩膜通常在限制了它们的性能的幅度上受到限制。此外,给定部分信号丢失,掩膜无法重构这些部分,因为它们仅将增益应用于时频位格来估计期望信号。
因此,需要一种改进的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080043612.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有可变调光膜的玻璃
- 下一篇:免洗型口腔护理组合物