[发明专利]语音增强方法、装置、设备、存储介质及程序有效

申请号：	202110465272.9	申请日：	2021-04-28
公开（公告）号：	CN113223552B	公开（公告）日：	2023-06-13
发明（设计）人：	夏洁;方思敏;罗丽云;李开	申请（专利权）人：	锐迪科微电子（上海）有限公司
主分类号：	G10L21/0216	分类号：	G10L21/0216
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	李哲;黄健
地址：	201203 上海市中国（上海）***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音增强方法装置设备存储介质程序
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供一种语音增强方法、装置、设备、存储介质及程序，该方法包括：获取通过麦克风阵列采集得到的语音信号，确定出语音信号在目标方向上的信干比，并根据信干比确定出目标方向对应的语音增强参数，进而，利用该语音增强参数对语音信号进行处理，得到增强后的语音信号。上述过程中，根据信干比确定语音增强参数的过程简单、易于实现，与采用基于聚类的CGMM方式、基于神经网络的方式相比，计算量较小，从而能够提高语音增强的实时性。

技术领域

本申请涉及数据处理技术领域，尤其涉及一种语音增强方法、装置、设备、存储介质及程序。

背景技术

在语音交互场景中，麦克风采集的语音信号通常带有噪声和/或干扰，因此，可以通过对采集到的语音信号进行处理，以提取出尽可能纯净的原始语音，这一过程被称为语音增强。

通常采用自适应波束形成算法进行语音增强。自适应波束形成算法能够根据周围环境噪声场的变化情况，不断调整语音增强参数(即用于进行语音增强的参数)以适应周围环境，从而保证语音增强的效果。相关技术中，在确定语音增强参数时，采用基于聚类的复数混合高斯模型(complex gaussian mixture model，CGMM)的方式，或者，采用基于神经网络的方式。

然而，上述两种方式的计算量较大，导致语音增强的实时性较差。

发明内容

本申请提供一种语音增强方法、装置、设备、存储介质及程序，用以提高语音增强的实时性。

第一方面，本申请提供一种语音增强方法，包括：

获取通过麦克风阵列采集得到的语音信号；

根据所述语音信号以及目标方向，确定所述语音信号在所述目标方向上的信干比，所述目标方向为目标声源对应的方向；

根据所述信干比，确定所述目标方向对应的语音增强参数；

根据所述语音增强参数对所述语音信号进行处理，得到增强后的语音信号。

一种可能的实现方式中，所述语音增强参数为最小方差无失真响应MVDR波束形成权重参数；根据所述信干比，确定所述目标方向对应的语音增强参数，包括：

根据所述信干比，确定所述语音信号在所述目标方向上的掩蔽值，所述掩蔽值用于指示所述语音信号中的噪声干扰信号对纯净语音信号的遮蔽程度；

根据所述掩蔽值，确定所述目标方向对应的所述MVDR波束形成权重参数。

一种可能的实现方式中，根据所述信干比，确定所述语音信号在所述目标方向上的掩蔽值，包括：