[发明专利]用于音频信号噪声抑制的方法和系统有效

申请号：	201280053432.8	申请日：	2012-08-31
公开（公告）号：	CN103907152A	公开（公告）日：	2014-07-02
发明（设计）人：	拉斯穆斯·孔斯格德·奥尔森	申请（专利权）人：	GN奈康有限公司
主分类号：	G10L21/0232	分类号：	G10L21/0232
代理公司：	北京康信知识产权代理有限责任公司 11240	代理人：	余刚;李静
地址：	丹麦巴***	国省代码：	丹麦;DK
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于音频信号噪声抑制方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及用于音频信号噪声抑制的装置、系统和方法，所述音频信号包括至少两个音频系统输入信号的组合，其中每个音频系统输入信号具有源信号部分和背景噪声部分。

背景技术

在音频通信中，典型地，不失真且无噪声地传输用户的声音是有利的。然而，通信装置经常在嘈杂环境中使用；装置的麦克风所拾取的信号是用户的声音和干扰噪声的混合体。

麦克风处的声场的特性根据不同的信号和噪声环境会大量变化。例如，该声音可能来自单一方向，或同时来自许多方向。其可能在远离麦克风或靠近麦克风的地方产生。其可能是平稳/恒定的，或是不平稳/瞬时的。噪声也可能由麦克风端口处的风湍流(wind turbulence)产生。

多麦克风背景降噪方法分为两个一般类别。第一种类型是波束成形，其中，将输出采样计算为输入采样的线性组合。第二种类型是噪声抑制，其中，通过对信号应用时变滤波器(time-variant filter)来减小噪声成分，例如，通过使滤波器组域(bank domain)中的信号上的与时间和频率相关的增益增加。

当仅一个麦克风或音频输入可用时，噪声抑制滤波器不可能是空间敏感的。无法获得声场的空间特征，提供与语音和背景噪声相关的判别信息，典型地，仅将其限制为，抑制背景噪声的平稳成分或准平稳成分。

波束成形和噪声抑制可以顺序地应用，因为它们的降噪效果是加成的。

在WO2009/132646A1中公开了适应性波束成形器的一个实例。

在O.Yilmaz和S.Rickard的Blind Separation of Speech Mixtures via Time-Frequency Masking(通过时频掩蔽而盲分离混合语音)，IEEE Transactions on Signal Processing(IEEE信号处理学报)，Vol.52，No.7，第1830至1847页，2004年7月)中，公开了一种分离混合声音的方法。在两个特征的基础上，以时频表示方式计算分离掩蔽，该两个特征即，两个传感器信号之间的级差和相位延迟。

在WO2009/096958A1中公开了一种将方向噪声抑制和平稳噪声抑制算法组合的方法。然而，此方法并未考虑空间噪声抑制成分，该空间噪声抑制成分除了方向特征以外，其还利用一组空间区别特征的组合。

发明内容

本发明所解决的噪声抑制的基本问题是，在时间和频率上，将声音信号分类成，主要感兴趣的信号(例如，用户的声音或语音)，或主要是干扰噪声，并应用相关过滤以减小输出信号中的噪声成分。当语音和噪声的分布不同时，此分类具有成功的机会。

使用不同的分布，文献中的许多方法提出了空间特征，该空间特征将信号映射至接下来将解决的一维分类问题。这种特征的实例是到达角、接近性、相关性以及和差比率。

本发明利用这样的事实：每个所提出的空间特征附有一定的不确定度，并且，有利地可以将它们组合，实现更高程度的分类精度，另外可通过任何一个单独空间特征来实现该更高程度的分类精度。已这样选择所提出的空间特征，使得，其中每个都对分类器增加分辨权重(power)。

在本发明的一个实施方式中，对分类器的输入是所提出的特征的加权和。

因此，本发明的一个目的是，在个人通信装置的传输路径中提供一种噪声抑制器，该噪声抑制器消除平稳噪声以及非平稳背景噪声。

根据本发明的第一方面，这个目的通过音频信号噪声抑制的方法来实现，该音频信号包括至少两个音频系统输入信号的组合，其中每个输入信号都具有声源信号部分和背景噪声部分，该方法包括以下步骤：

a)从输入信号中提取至少两种不同类型的空间声场特征，例如，区别语音和/或背景噪声特征，

b)在所提取的空间声场特征的基础上，计算第一中间空间噪声抑制增益，

c)计算第二中间平稳噪声抑制增益，

d)将两个中间噪声抑制增益相组合，以形成总噪声抑制增益，其中，通过比较它们的值，并根据它们的比率或相对差，来组合两个中间噪声抑制增益，确定总噪声抑制增益，

e)将总噪声抑制增益施加至音频信号，以产生噪声抑制的音频系统输出信号。

有利地，可针对至少一个频率次频带(sub-band)，在频域中执行该方法。可以应用傅里叶转换的众所周知的方法(例如，快速傅里叶转换(FFT))，将信号从时域转换至频域。结果，可以在每个频带中应用最优滤波。可每20毫秒(ms)或在任何其他适当的时间间隔下，用FFT算法计算新的频谱。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于GN奈康有限公司，未经GN奈康有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201280053432.8/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于音频信号噪声抑制的方法和系统有效

专利文献下载