[发明专利]用于音频信号噪声抑制的方法和系统有效
申请号: | 201280053432.8 | 申请日: | 2012-08-31 |
公开(公告)号: | CN103907152A | 公开(公告)日: | 2014-07-02 |
发明(设计)人: | 拉斯穆斯·孔斯格德·奥尔森 | 申请(专利权)人: | GN奈康有限公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚;李静 |
地址: | 丹麦巴*** | 国省代码: | 丹麦;DK |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 音频 信号 噪声 抑制 方法 系统 | ||
本发明涉及用于音频信号噪声抑制的装置、系统和方法,所述音频信号包括至少两个音频系统输入信号的组合,其中每个音频系统输入信号具有源信号部分和背景噪声部分。
背景技术
在音频通信中,典型地,不失真且无噪声地传输用户的声音是有利的。然而,通信装置经常在嘈杂环境中使用;装置的麦克风所拾取的信号是用户的声音和干扰噪声的混合体。
麦克风处的声场的特性根据不同的信号和噪声环境会大量变化。例如,该声音可能来自单一方向,或同时来自许多方向。其可能在远离麦克风或靠近麦克风的地方产生。其可能是平稳/恒定的,或是不平稳/瞬时的。噪声也可能由麦克风端口处的风湍流(wind turbulence)产生。
多麦克风背景降噪方法分为两个一般类别。第一种类型是波束成形,其中,将输出采样计算为输入采样的线性组合。第二种类型是噪声抑制,其中,通过对信号应用时变滤波器(time-variant filter)来减小噪声成分,例如,通过使滤波器组域(bank domain)中的信号上的与时间和频率相关的增益增加。
当仅一个麦克风或音频输入可用时,噪声抑制滤波器不可能是空间敏感的。无法获得声场的空间特征,提供与语音和背景噪声相关的判别信息,典型地,仅将其限制为,抑制背景噪声的平稳成分或准平稳成分。
波束成形和噪声抑制可以顺序地应用,因为它们的降噪效果是加成的。
在WO2009/132646A1中公开了适应性波束成形器的一个实例。
在O.Yilmaz和S.Rickard的Blind Separation of Speech Mixtures via Time-Frequency Masking(通过时频掩蔽而盲分离混合语音),IEEE Transactions on Signal Processing(IEEE信号处理学报),Vol.52,No.7,第1830至1847页,2004年7月)中,公开了一种分离混合声音的方法。在两个特征的基础上,以时频表示方式计算分离掩蔽,该两个特征即,两个传感器信号之间的级差和相位延迟。
在WO2009/096958A1中公开了一种将方向噪声抑制和平稳噪声抑制算法组合的方法。然而,此方法并未考虑空间噪声抑制成分,该空间噪声抑制成分除了方向特征以外,其还利用一组空间区别特征的组合。
发明内容
本发明所解决的噪声抑制的基本问题是,在时间和频率上,将声音信号分类成,主要感兴趣的信号(例如,用户的声音或语音),或主要是干扰噪声,并应用相关过滤以减小输出信号中的噪声成分。当语音和噪声的分布不同时,此分类具有成功的机会。
使用不同的分布,文献中的许多方法提出了空间特征,该空间特征将信号映射至接下来将解决的一维分类问题。这种特征的实例是到达角、接近性、相关性以及和差比率。
本发明利用这样的事实:每个所提出的空间特征附有一定的不确定度,并且,有利地可以将它们组合,实现更高程度的分类精度,另外可通过任何一个单独空间特征来实现该更高程度的分类精度。已这样选择所提出的空间特征,使得,其中每个都对分类器增加分辨权重(power)。
在本发明的一个实施方式中,对分类器的输入是所提出的特征的加权和。
因此,本发明的一个目的是,在个人通信装置的传输路径中提供一种噪声抑制器,该噪声抑制器消除平稳噪声以及非平稳背景噪声。
根据本发明的第一方面,这个目的通过音频信号噪声抑制的方法来实现,该音频信号包括至少两个音频系统输入信号的组合,其中每个输入信号都具有声源信号部分和背景噪声部分,该方法包括以下步骤:
a)从输入信号中提取至少两种不同类型的空间声场特征,例如,区别语音和/或背景噪声特征,
b)在所提取的空间声场特征的基础上,计算第一中间空间噪声抑制增益,
c)计算第二中间平稳噪声抑制增益,
d)将两个中间噪声抑制增益相组合,以形成总噪声抑制增益,其中,通过比较它们的值,并根据它们的比率或相对差,来组合两个中间噪声抑制增益,确定总噪声抑制增益,
e)将总噪声抑制增益施加至音频信号,以产生噪声抑制的音频系统输出信号。
有利地,可针对至少一个频率次频带(sub-band),在频域中执行该方法。可以应用傅里叶转换的众所周知的方法(例如,快速傅里叶转换(FFT)),将信号从时域转换至频域。结果,可以在每个频带中应用最优滤波。可每20毫秒(ms)或在任何其他适当的时间间隔下,用FFT算法计算新的频谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于GN奈康有限公司,未经GN奈康有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280053432.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于汽车的宽体套件
- 下一篇:拖拉机机罩撑杆装置