[发明专利]音频增强方法及系统有效
申请号: | 201910738885.8 | 申请日: | 2019-08-12 |
公开(公告)号: | CN110400572B | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 任维怡;周强 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;邓婷婷 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 增强 方法 系统 | ||
1.一种音频增强方法,包括:
步骤S101,通过波达方向估计算法获取原始多路音频的空间谱,所述原始多路音频通过麦克风阵列采集获取;
步骤S102,从所述空间谱中获取大于设定阈值的多个峰值;根据DOA波达估计方法获取多个所述峰值的多个估计方向值;根据所述多个估计方向值及麦克风阵列的导向矢量获取所述多个估计方向值的空间协方差矩阵;
步骤S103,根据所述空间协方差矩阵初始化并建立CGMM复高斯混合模型;
步骤S104,通过聚类方法迭代更新所述CGMM复高斯混合模型的参数,通过迭代后的CGMM复高斯混合模型获取各类别在时频点的掩蔽值;
步骤S105,通过MVDR最小方差无失真响应波束形成算法增强所述原始多路音频,获取增强音频文件;
其中,所述步骤S105中还包括:
步骤S1051,根据所述原始音频协方差矩阵及所述各类别在时频点的掩蔽值获取干扰和噪声协方差矩阵;
步骤S1052,根据所述干扰和噪声协方差矩阵、所述多个估计方向值及所述导向矢量获取波束形成器的最优权值;
步骤S1053,通过所述波束形成器实现所述MVDR最小方差无失真响应波束形成算法。
2.根据权利要求1所述的音频增强方法,其中,所述步骤S103中还包括:
根据所述多个估计方向值的协方差矩阵初始化并建立所述CGMM复高斯混合模型;
将所述CGMM复高斯混合模型中的噪声类初始化为单位矩阵。
3.根据权利要求1所述的音频增强方法,其中,所述步骤S101中所述波达方向估计算法为MUSIC多重信号分类算法。
4.根据权利要求1所述的音频增强方法,其中,所述步骤S104中包括:
通过设定迭代算法及设定迭代次数迭代所述CGMM复高斯混合模型的参数;
所述迭代算法为EM期望最大化算法,所述迭代次数为4~5次。
5.根据权利要求1所述的音频增强方法,其中,所述步骤S105后还包括:
步骤S106,通过语音识别算法识别所述增强音频文件,获取语音识别结果。
6.一种音频增强系统,包括空间谱创建单元、矩阵获取单元、模型建立单元、迭代单元及增强单元,其中:
空间谱创建单元,配置为通过波达方向估计算法获取原始多路音频的空间谱,所述原始多路音频通过麦克风阵列采集获取;
矩阵获取单元,配置为从所述空间谱中获取大于设定阈值的多个峰值;根据DOA波达估计方法获取多个所述峰值的多个估计方向值;根据所述多个估计方向值及麦克风阵列的导向矢量获取所述多个估计方向值的空间协方差矩阵;
模型建立单元,配置为根据所述空间协方差矩阵初始化并建立CGMM复高斯混合模型;
迭代单元,配置为通过聚类方法迭代更新所述CGMM复高斯混合模型的参数,通过迭代后的CGMM复高斯混合模型获取各类别在时频点的掩蔽值;
增强单元,配置为通过MVDR最小方差无失真响应波束形成算法增强所述原始多路音频,获取增强音频;
其中,所述增强单元还配置为,根据所述原始音频协方差矩阵及所述各类别在时频点的掩蔽值获取干扰和噪声协方差矩阵;根据所述干扰和噪声协方差矩阵、所述多个估计方向值及所述导向矢量获取波束形成器的最优权值;通过所述波束形成器实现所述MVDR最小方差无失真响应波束形成算法。
7.根据权利要求6所述的音频增强系统,其中:
所述模型建立单元还配置为,根据所述多个估计方向值的协方差矩阵初始化并建立所述CGMM复高斯混合模型;将所述CGMM复高斯混合模型中的噪声类初始化为单位矩阵。
8.根据权利要求6所述的音频增强系统,其中:
所述空间谱创建单元中所述波达方向估计算法为MUSIC多重信号分类算法;
所述迭代单元还配置为,通过设定迭代算法及设定迭代次数迭代所述CGMM复高斯混合模型的参数;所述迭代算法为EM期望最大化算法,所述迭代次数为4~5次;
所述音频增强系统还包括语音识别单元,所述语音识别单元配置为通过语音识别算法识别所述增强音频文件,并获取语音识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910738885.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:音频处理方法、装置、存储介质及电子设备
- 下一篇:一种数据处理的方法及装置