[发明专利]语音增强方法、装置、设备、存储介质及程序有效
申请号: | 202110465272.9 | 申请日: | 2021-04-28 |
公开(公告)号: | CN113223552B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 夏洁;方思敏;罗丽云;李开 | 申请(专利权)人: | 锐迪科微电子(上海)有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 李哲;黄健 |
地址: | 201203 上海市中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 方法 装置 设备 存储 介质 程序 | ||
本申请提供一种语音增强方法、装置、设备、存储介质及程序,该方法包括:获取通过麦克风阵列采集得到的语音信号,确定出语音信号在目标方向上的信干比,并根据信干比确定出目标方向对应的语音增强参数,进而,利用该语音增强参数对语音信号进行处理,得到增强后的语音信号。上述过程中,根据信干比确定语音增强参数的过程简单、易于实现,与采用基于聚类的CGMM方式、基于神经网络的方式相比,计算量较小,从而能够提高语音增强的实时性。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种语音增强方法、装置、设备、存储介质及程序。
背景技术
在语音交互场景中,麦克风采集的语音信号通常带有噪声和/或干扰,因此,可以通过对采集到的语音信号进行处理,以提取出尽可能纯净的原始语音,这一过程被称为语音增强。
通常采用自适应波束形成算法进行语音增强。自适应波束形成算法能够根据周围环境噪声场的变化情况,不断调整语音增强参数(即用于进行语音增强的参数)以适应周围环境,从而保证语音增强的效果。相关技术中,在确定语音增强参数时,采用基于聚类的复数混合高斯模型(complex gaussian mixture model,CGMM)的方式,或者,采用基于神经网络的方式。
然而,上述两种方式的计算量较大,导致语音增强的实时性较差。
发明内容
本申请提供一种语音增强方法、装置、设备、存储介质及程序,用以提高语音增强的实时性。
第一方面,本申请提供一种语音增强方法,包括:
获取通过麦克风阵列采集得到的语音信号;
根据所述语音信号以及目标方向,确定所述语音信号在所述目标方向上的信干比,所述目标方向为目标声源对应的方向;
根据所述信干比,确定所述目标方向对应的语音增强参数;
根据所述语音增强参数对所述语音信号进行处理,得到增强后的语音信号。
一种可能的实现方式中,所述语音增强参数为最小方差无失真响应MVDR波束形成权重参数;根据所述信干比,确定所述目标方向对应的语音增强参数,包括:
根据所述信干比,确定所述语音信号在所述目标方向上的掩蔽值,所述掩蔽值用于指示所述语音信号中的噪声干扰信号对纯净语音信号的遮蔽程度;
根据所述掩蔽值,确定所述目标方向对应的所述MVDR波束形成权重参数。
一种可能的实现方式中,根据所述信干比,确定所述语音信号在所述目标方向上的掩蔽值,包括:
若所述信干比大于预设阈值,则确定所述掩蔽值为第一预设值;或者,
若所述信干比小于或者等于所述预设阈值,则确定所述掩蔽值为第二预设值。
一种可能的实现方式中,根据所述掩蔽值,确定所述目标方向对应的所述MVDR波束形成权重参数,包括:
根据所述掩蔽值,确定所述语音信号对应的噪声干扰协方差矩阵;
根据所述噪声干扰协方差矩阵,以及所述麦克风阵列在所述目标方向的导向矢量,确定所述目标方向对应的所述MVDR波束形成权重参数。
一种可能的实现方式中,根据所述语音增强参数对所述语音信号进行处理,得到增强后的语音信号,包括:
根据所述MVDR波束形成权重参数对所述语音信号进行MVDR波束形成处理,得到增强后的语音信号。
一种可能的实现方式中,根据所述语音信号以及目标方向,确定所述语音信号在所述目标方向上的信干比,包括:
根据所述目标方向,从所述语音信号中提取得到目标信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于锐迪科微电子(上海)有限公司,未经锐迪科微电子(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110465272.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种装载机斗齿及其热处理方法
- 下一篇:一种虚拟仿真飞行模拟器