[发明专利]用于音频信号噪声抑制的方法和系统有效

专利信息
申请号: 201280053432.8 申请日: 2012-08-31
公开(公告)号: CN103907152A 公开(公告)日: 2014-07-02
发明(设计)人: 拉斯穆斯·孔斯格德·奥尔森 申请(专利权)人: GN奈康有限公司
主分类号: G10L21/0232 分类号: G10L21/0232
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 余刚;李静
地址: 丹麦巴*** 国省代码: 丹麦;DK
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 音频 信号 噪声 抑制 方法 系统
【说明书】:

发明涉及用于音频信号噪声抑制的装置、系统和方法,所述音频信号包括至少两个音频系统输入信号的组合,其中每个音频系统输入信号具有源信号部分和背景噪声部分。

背景技术

在音频通信中,典型地,不失真且无噪声地传输用户的声音是有利的。然而,通信装置经常在嘈杂环境中使用;装置的麦克风所拾取的信号是用户的声音和干扰噪声的混合体。

麦克风处的声场的特性根据不同的信号和噪声环境会大量变化。例如,该声音可能来自单一方向,或同时来自许多方向。其可能在远离麦克风或靠近麦克风的地方产生。其可能是平稳/恒定的,或是不平稳/瞬时的。噪声也可能由麦克风端口处的风湍流(wind turbulence)产生。

多麦克风背景降噪方法分为两个一般类别。第一种类型是波束成形,其中,将输出采样计算为输入采样的线性组合。第二种类型是噪声抑制,其中,通过对信号应用时变滤波器(time-variant filter)来减小噪声成分,例如,通过使滤波器组域(bank domain)中的信号上的与时间和频率相关的增益增加。

当仅一个麦克风或音频输入可用时,噪声抑制滤波器不可能是空间敏感的。无法获得声场的空间特征,提供与语音和背景噪声相关的判别信息,典型地,仅将其限制为,抑制背景噪声的平稳成分或准平稳成分。

波束成形和噪声抑制可以顺序地应用,因为它们的降噪效果是加成的。

在WO2009/132646A1中公开了适应性波束成形器的一个实例。

在O.Yilmaz和S.Rickard的Blind Separation of Speech Mixtures via Time-Frequency Masking(通过时频掩蔽而盲分离混合语音),IEEE Transactions on Signal Processing(IEEE信号处理学报),Vol.52,No.7,第1830至1847页,2004年7月)中,公开了一种分离混合声音的方法。在两个特征的基础上,以时频表示方式计算分离掩蔽,该两个特征即,两个传感器信号之间的级差和相位延迟。

在WO2009/096958A1中公开了一种将方向噪声抑制和平稳噪声抑制算法组合的方法。然而,此方法并未考虑空间噪声抑制成分,该空间噪声抑制成分除了方向特征以外,其还利用一组空间区别特征的组合。

发明内容

本发明所解决的噪声抑制的基本问题是,在时间和频率上,将声音信号分类成,主要感兴趣的信号(例如,用户的声音或语音),或主要是干扰噪声,并应用相关过滤以减小输出信号中的噪声成分。当语音和噪声的分布不同时,此分类具有成功的机会。

使用不同的分布,文献中的许多方法提出了空间特征,该空间特征将信号映射至接下来将解决的一维分类问题。这种特征的实例是到达角、接近性、相关性以及和差比率。

本发明利用这样的事实:每个所提出的空间特征附有一定的不确定度,并且,有利地可以将它们组合,实现更高程度的分类精度,另外可通过任何一个单独空间特征来实现该更高程度的分类精度。已这样选择所提出的空间特征,使得,其中每个都对分类器增加分辨权重(power)。

在本发明的一个实施方式中,对分类器的输入是所提出的特征的加权和。

因此,本发明的一个目的是,在个人通信装置的传输路径中提供一种噪声抑制器,该噪声抑制器消除平稳噪声以及非平稳背景噪声。

根据本发明的第一方面,这个目的通过音频信号噪声抑制的方法来实现,该音频信号包括至少两个音频系统输入信号的组合,其中每个输入信号都具有声源信号部分和背景噪声部分,该方法包括以下步骤:

a)从输入信号中提取至少两种不同类型的空间声场特征,例如,区别语音和/或背景噪声特征,

b)在所提取的空间声场特征的基础上,计算第一中间空间噪声抑制增益,

c)计算第二中间平稳噪声抑制增益,

d)将两个中间噪声抑制增益相组合,以形成总噪声抑制增益,其中,通过比较它们的值,并根据它们的比率或相对差,来组合两个中间噪声抑制增益,确定总噪声抑制增益,

e)将总噪声抑制增益施加至音频信号,以产生噪声抑制的音频系统输出信号。

有利地,可针对至少一个频率次频带(sub-band),在频域中执行该方法。可以应用傅里叶转换的众所周知的方法(例如,快速傅里叶转换(FFT)),将信号从时域转换至频域。结果,可以在每个频带中应用最优滤波。可每20毫秒(ms)或在任何其他适当的时间间隔下,用FFT算法计算新的频谱。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于GN奈康有限公司,未经GN奈康有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201280053432.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top