[发明专利]语音增强方法、装置、设备和存储介质有效
申请号: | 202110287956.4 | 申请日: | 2021-03-17 |
公开(公告)号: | CN112951263B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 关海欣;梁家恩 | 申请(专利权)人: | 云知声智能科技股份有限公司;深圳云知声信息技术有限公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L21/0216 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 方法 装置 设备 存储 介质 | ||
1.一种语音增强方法,其特征在于,包括:
对获取的语音数据中每个通道的音频信号进行转换得到每个通道的频域信号;
根据选取的参考通道的音频信号的相位,对每个通道的音频信号进行频率移除,得到每个通道的频率移除信号;
对每个通道的频率移除信号进行幅值移除,得到每个通道的幅值移除信号作为所述每个通道的规整信号;其中,所述规整信号为仅与麦克风阵列拓扑结构相关联的信号;
利用预设长度的样本数据对应的每个通道的样本规整信号,对待训练复高斯混合模型进行训练,得到训练后的目标复高斯混合模型;
利用所述目标复高斯混合模型,确定所述语音数据的时频掩膜信息;
利用所述语音数据的时频掩膜信息,对所述语音数据进行波束增强,得到增强语音数据。
2.根据权利要求1所述的语音增强方法,其特征在于,根据选取的参考通道的音频信号的相位,对每个通道的音频信号进行频率移除,得到每个通道的频率移除信号,包括:
计算每个通道的音频信号与参考通道音频信号的相位差;
对计算的每个相位差进行规制,得到每个规制相位差;
将每个规制相位差与对应音频信号的模相乘,得到每个通道的频率移除信号。
3.根据权利要求1所述的语音增强方法,其特征在于,利用所述语音数据的时频掩膜信息,对所述语音数据进行波束增强,得到增强语音数据,包括:
根据语音数据的时频掩膜信息,计算语音协方差矩阵和噪声协方差矩阵;
根据语音协方差矩阵和噪声协方差矩阵,确定波束形成器的最优权值;
通过波束形成器实现MVDR最小方差无失真响应波束形成算法,对所述语音数据进行波束增强,得到所述增强语音数据。
4.一种语音增强装置,其特征在于,包括:
转换模块,用于对获取的语音数据中每个通道的音频信号进行转换得到每个通道的频域信号;
规整模块,用于根据选取的参考通道的音频信号的相位,对每个通道的音频信号进行频率移除,得到每个通道的频率移除信号;对每个通道的频率移除信号进行幅值移除,得到每个通道的幅值移除信号作为所述每个通道的规整信号;其中,所述规整信号为仅与麦克风阵列拓扑结构相关联的信号;
训练模块,用于利用预设长度的样本数据对应的每个通道的样本规整信号,对待训练复高斯混合CGMM模型进行训练,得到训练后的目标CGMM模型;
确定模块,用于利用所述目标CGMM模型,确定所述语音数据的时频掩膜信息;
增强模块,用于利用所述语音数据的时频掩膜信息,对所述语音数据进行波束增强,得到增强语音数据。
5.根据权利要求4所述的语音增强装置,其特征在于,所述规整模块还用于:
计算每个通道的音频信号与参考通道音频信号的相位的相位差;
对计算的每个相位差进行规制,得到每个规制相位差;
将每个规制相位差与对应音频信号的模相乘,得到每个通道的频率移除信号。
6.根据权利要求4所述的语音增强装置,其特征在于,所述增强模块,具体用于:
根据语音数据的时频掩膜信息,计算语音协方差矩阵和噪声协方差矩阵;
根据语音协方差矩阵和噪声协方差矩阵,确定波束形成器的最优权值;
通过波束形成器实现MVDR最小方差无失真响应波束形成算法,对所述语音数据进行波束增强,得到所述增强语音数据。
7.一种语音增强设备,其特征在于,包括:处理器和存储器;
所述处理器用于执行所述存储器中存储的应用程序,以实现权利要求1-3任一项所述的语音增强方法。
8.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被执行时实现权利要求1-3 任一项所述的语音增强方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;深圳云知声信息技术有限公司,未经云知声智能科技股份有限公司;深圳云知声信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110287956.4/1.html,转载请声明来源钻瓜专利网。