[发明专利]一种远场噪声抑制方法、装置和系统有效
申请号: | 201811012141.X | 申请日: | 2018-08-31 |
公开(公告)号: | CN110875054B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 余涛;银鞍 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0264;G10L25/03 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;窦晓慧 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 噪声 抑制 方法 装置 系统 | ||
本申请公开一种远场噪声抑制方法,以及一种远场噪声抑制装置和系统。其中,远场噪声抑制方法包括:根据获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束,获得语音波束的能量和噪声波束的能量,对语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,根据该双路噪声能量和语音波束的能量,获得用于消除非平稳噪声的第一参数,根据该第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。通过在语音波束的基础上,进一步的结合噪声波束对语音信号中的非平稳噪声做出准确的估计,实现了非平稳噪声的消除,从而能够在复杂环境下提高远场语音识别的准确率。
技术领域
本申请涉及远场语音信号处理领域,具体涉及一种远场噪声抑制方法。本申请同时涉及一种远场噪声抑制装置和系统。
背景技术
随着人工智能技术的不断发展,作为一项人机交互的关键技术,远场语音识别正变的越来越重要,人们希望机器能够听懂人类的语音指令,从而实现对机器的控制。尽管语音识别技术在过去几十年里取得了飞速的发展,但是,目前的远场语音识别对环境的依赖性依然较强,大量的环境噪声也使得远场语音识别的准确性严重下降。随着语音通信设备的应用场景(例如,商场、车站、街道等)越来越多,伴随语音信号的噪声信号类型也越来越多,这其中不仅存在大量的平稳噪声信号也存在大量的非平稳噪声信号。这就要求对语音信号进行噪声估计的方法需具备更好的适应能力,对语音信号中的噪声做出准确的估计,从而抑制远场语音信号中的噪声信号。
为了解决上述问题,本领域中现有技术,通常是利用单路噪声估计方法对语音信号中的噪声进行估计,从而能够在一定程度上消除语音识别过程中的噪声信号,提高语音信号识别的准确率。但是,单路噪声估计方法也暴露出以下缺陷:由于仅仅以一路目标语音波束作为依据,噪声估计存在一定的局限性,进而仍然不能很好的消除噪音,尤其是在复杂的环境噪声中,对噪声估计的可靠性较低,对噪声估计结果的不准确,从而导致远场语音识别准确率较低。
发明内容
本申请提供一种远场噪声抑制方法,以解决现有技术在复杂的环境噪声中,对噪声估计的可靠性较低,对噪声估计结果的不准确的问题。本申请另外提供一种远场噪声抑制装置和系统。
本申请提供的一种远场噪声抑制方法,包括:
获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束;
根据所述语音波束和噪声波束,获得语音波束的能量和噪声波束的能量;
对所述语音波束的能量和噪声波束的能量进行对比分析,获得双路噪声能量,所述双路噪声能量为非平稳噪声的能量;
根据所述双路噪声能量和所述语音波束的能量,获得用于消除非平稳噪声的第一参数;
根据所述第一参数对所述语音波束进行滤波处理,获得第一增强语音数据。
可选的,所述的远场噪声抑制方法还包括:
对所述语音波束进行单路噪声估计,获得单路噪声能量,所述单路噪声能量为平稳噪声的能量;
根据所述双路噪声能量、单路噪声能量和所述语音波束的能量进行噪声综合分析,获得综合噪声能量;
根据所述综合噪声能量和语音波束的能量,获得用于消除非平稳噪声和平稳噪声的第二参数;
根据所述第二参数对所述语音波束进行滤波处理,获得第二增强语音数据。
可选的,所述第一参数为用于抑制非平稳噪声数据的第一维纳滤波系数;
所述第二参数为用于抑制平稳噪声数据和非平稳噪声数据的第二维纳滤波系数。
可选的,所述获得语音波束的能量和噪声波束的能量,具体包括:获得第一时间点的语音波束的能量和第一时间点的噪声波束的能量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811012141.X/2.html,转载请声明来源钻瓜专利网。