[发明专利]噪声门、声音采集装置及噪声消除方法有效
申请号: | 200980146295.0 | 申请日: | 2009-11-18 |
公开(公告)号: | CN102216984A | 公开(公告)日: | 2011-10-12 |
发明(设计)人: | 田中良;栗山直人 | 申请(专利权)人: | 雅马哈株式会社 |
主分类号: | G10L21/02 | 分类号: | G10L21/02 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 陈源;张天舒 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 噪声 声音 采集 装置 消除 方法 | ||
技术领域
本发明涉及用于消除音频信号中所含噪声的噪声门,还涉及声音采集装置及噪声消除方法。
背景技术
现有技术的声音采集装置中提供有噪声门来作为用于消除噪声的单元(例如,专利文件1)。
例如,专利文件1公开了一种噪声门装置,其按照用于放大音频信号的前置放大器的放大率来改变噪声门的阈值,并且消除低于该阈值的音频信号。
现有技术文件
专利文件
专利文件1:JP-A-2006-50067
发明内容
本发明要解决的问题
然而,专利文件1中描述的噪声门装置消除了低于阈值的音频信号。因此,对于在该低于阈值的音频信号中包含了讲话者的发言语音的情况,会发生这样的问题,即,信号电平低于阈值的发言语音被噪声门消除了。
考虑上述问题,本发明的目的是提供噪声门、声音采集装置及噪声消除方法,它们各自都能够容易地消除恒定噪声而不降低音频信号质量。
解决问题的方式
根据本发明的噪声门基于输入音频信号的频谱来对该输入音频信号中所含恒定噪声(以下称为恒定噪声)的噪声谱进行评估。该噪声门计算输入音频信号的频谱与评估所得噪声谱的信号电平比。噪声门输出其中一个频带中的信号电平被降低了的音频信号的频谱,该频带是所计算出的信号电平比低于预定阈值的频带。
以此配置,噪声门输出了包括讲话者发言语音的音频信号的频谱,并抑制了恒定噪声所形成的音频信号的频谱中的信号电平,从而能够输出仅仅消除了其中的恒定噪声的音频信号而不会降低讲话者发言语音的质量。
另外,可根据与评估单元的评估误差相对应的值将用来与信号电平比进行比较的阈值设置为大于1的值。由于噪声门使用评估所得恒定噪声来对将要与阈值进行比较的信号电平比进行计算,所以要考虑恒定噪声的评估误差。
以此配置,即使在恒定噪声的信号电平被评估为低于实际值的值时,噪声门也能将该恒定噪声消除掉。
另外,根据本发明的声音采集装置具有上述噪声门。声音采集装置把通过采集声音而生成的音频信号转换成频谱来作为频域的信号并将该频域的信号输出到噪声门。另外,声音采集装置还将从噪声门输出的音频信号的频谱逆变换成音频信号来作为时域的信号。
以此配置,声音采集装置能够利用上述噪声门来将恒定噪声从采集到的音频信号中消除。因此,声音采集装置能够在不降低所采集到的讲话者发言语音质量的情况下输出声音。
根据本发明的噪声消除方法包括以下处理:输出音频信号的频谱;根据输入处理中所输入的音频信号的频谱来评估噪声谱;计算音频信号的频谱与在评估处理中评估所得的噪声谱之间的信号电平比;以及输出其中一个频带中的增益被降低了的音频信号的频谱,该频带是计算处理中计算出的信号电平比低于预定阈值的频带。
另外,可根据与评估处理中用到的评估单元的评估误差相对应的值将用来与信号电平比进行比较的阈值设置为大于1的值。
发明的优点
根据本发明的噪声门能够输出消除了恒定噪声的音频信号而不会降低讲话者发言语音的质量。
附图说明
图1是示出声音采集装置的功能和结构的框图。
图2是示出增益表的一个示例的示图。
图3(A)、图3(B)和图3(C)是分别示出恒定噪声、音频信号和消除噪声后的音频信号的示例的示图。
图4是示出增益表的另一个示例的示图。
具体实施方式
下面将参考图1和图2来描述根据本发明的声音采集装置1。图1是示出声音采集装置1的功能和结构的框图。图2是示出增益表的一个示例的示图。声音采集装置1具有噪声门12(见图1)。声音采集装置1将采集到的音频信号NE′T转换成频谱NE′N。声音采集装置1使用噪声门12将音频信号NE′N中所含的恒定噪声N′N消除掉。此时,由噪声门12根据频谱NE′N对恒定噪声N′N进行评估。声音采集装置1输出音频信号CO′T,该音频信号CO′T是通过对消除了恒定噪声N′N之后的频谱CO′N关于时间轴进行逆变换的方式而生成的。同时在下面的描述中,时域中的结束符号用′T来指示,频域中的结束符号用′N来指示。
首先参考图1和图2来描述声音采集装置1的功能和结构。如图1所示,声音采集装置1包括麦克风MIC、FFT处理单元11、噪声门12以及IFFT处理单元13。
麦克风MIC通过采集环境声音来生成音频信号。麦克风MIC将所生成的音频信号NE′T输出到FFT处理单元11。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雅马哈株式会社,未经雅马哈株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980146295.0/2.html,转载请声明来源钻瓜专利网。