[发明专利]一种远场噪声抑制方法、装置和系统有效

申请号：	201811012141.X	申请日：	2018-08-31
公开（公告）号：	CN110875054B	公开（公告）日：	2023-07-25
发明（设计）人：	余涛;银鞍	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G10L21/0216	分类号：	G10L21/0216;G10L21/0264;G10L25/03
代理公司：	北京清源汇知识产权代理事务所(特殊普通合伙) 11644	代理人：	冯德魁;窦晓慧
地址：	英属开曼群岛大开***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种噪声抑制方法装置系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开一种远场噪声抑制方法，以及一种远场噪声抑制装置和系统。其中，远场噪声抑制方法包括：根据获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束，获得语音波束的能量和噪声波束的能量，对语音波束的能量和噪声波束的能量进行对比分析，获得双路噪声能量，根据该双路噪声能量和语音波束的能量，获得用于消除非平稳噪声的第一参数，根据该第一参数对所述语音波束进行滤波处理，获得第一增强语音数据。通过在语音波束的基础上，进一步的结合噪声波束对语音信号中的非平稳噪声做出准确的估计，实现了非平稳噪声的消除，从而能够在复杂环境下提高远场语音识别的准确率。

技术领域

本申请涉及远场语音信号处理领域，具体涉及一种远场噪声抑制方法。本申请同时涉及一种远场噪声抑制装置和系统。

背景技术

随着人工智能技术的不断发展，作为一项人机交互的关键技术，远场语音识别正变的越来越重要，人们希望机器能够听懂人类的语音指令，从而实现对机器的控制。尽管语音识别技术在过去几十年里取得了飞速的发展，但是，目前的远场语音识别对环境的依赖性依然较强，大量的环境噪声也使得远场语音识别的准确性严重下降。随着语音通信设备的应用场景(例如，商场、车站、街道等)越来越多，伴随语音信号的噪声信号类型也越来越多，这其中不仅存在大量的平稳噪声信号也存在大量的非平稳噪声信号。这就要求对语音信号进行噪声估计的方法需具备更好的适应能力，对语音信号中的噪声做出准确的估计，从而抑制远场语音信号中的噪声信号。

为了解决上述问题，本领域中现有技术，通常是利用单路噪声估计方法对语音信号中的噪声进行估计，从而能够在一定程度上消除语音识别过程中的噪声信号，提高语音信号识别的准确率。但是，单路噪声估计方法也暴露出以下缺陷：由于仅仅以一路目标语音波束作为依据，噪声估计存在一定的局限性，进而仍然不能很好的消除噪音，尤其是在复杂的环境噪声中，对噪声估计的可靠性较低，对噪声估计结果的不准确，从而导致远场语音识别准确率较低。

发明内容

本申请提供一种远场噪声抑制方法，以解决现有技术在复杂的环境噪声中，对噪声估计的可靠性较低，对噪声估计结果的不准确的问题。本申请另外提供一种远场噪声抑制装置和系统。

本申请提供的一种远场噪声抑制方法，包括：

获取第一麦克风采集的语音波束和第二麦克风采集的噪声波束；

根据所述语音波束和噪声波束，获得语音波束的能量和噪声波束的能量；

对所述语音波束的能量和噪声波束的能量进行对比分析，获得双路噪声能量，所述双路噪声能量为非平稳噪声的能量；

根据所述双路噪声能量和所述语音波束的能量，获得用于消除非平稳噪声的第一参数；

根据所述第一参数对所述语音波束进行滤波处理，获得第一增强语音数据。

可选的，所述的远场噪声抑制方法还包括：

对所述语音波束进行单路噪声估计，获得单路噪声能量，所述单路噪声能量为平稳噪声的能量；

根据所述双路噪声能量、单路噪声能量和所述语音波束的能量进行噪声综合分析，获得综合噪声能量；

根据所述综合噪声能量和语音波束的能量，获得用于消除非平稳噪声和平稳噪声的第二参数；