[发明专利]一种音频数据处理的方法及装置、电子设备、存储介质有效
申请号: | 201911207689.4 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110970046B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 罗大为 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L21/0224;G10L21/0232;G10L21/0264;G10L25/03 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 郑傲日 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 数据处理 方法 装置 电子设备 存储 介质 | ||
本申请实施例提供了一种音频数据处理的方法及装置、电子设备、存储介质,所述方法包括:获取第一多通道音频数据;其中,第一多通道音频数据由一个或多个麦克风阵列采集的音频数据组成;对第一多通道音频数据进行解混响处理,得到第二多通道音频数据;生成针对第二多通道音频数据的时频掩码;根据时频掩码,对第二多通道音频数据进行波束形成处理,得到第一单通道音频数据;采用第一单通道音频数据,进行音频信号输出。通过本申请实施例,实现了对非同步采集的多个麦克风阵列的音频处理,避免了仅能采用同步采集的统一阵列进行音频处理导致的高成本,扩大了拾音范围,提升了鲁棒性。
技术领域
本申请涉及音频数据处理领域,特别是涉及一种音频数据处理的方法及装置、电子设备、存储介质。
背景技术
目前,麦克风阵列技术通常集中于同步采集的统一阵列系统,而同步采集的统一阵列系统对硬件设计、制造及部署均有较高的要求。
而且,由于只能单点部署,若要覆盖更大的范围,则需要部署大孔径且数量较多的麦克风,而随着阵列系统中麦克风数量的增强,成本会快速上升,空间部署难度也会增加,且鲁棒性会显著下降。
发明内容
鉴于上述问题,提出了以便提供克服上述问题或者至少部分地解决上述问题的一种音频数据处理的方法及装置、电子设备、存储介质,包括:
一种音频数据处理的方法,所述方法包括:
获取第一多通道音频数据;其中,所述第一多通道音频数据由一个或多个麦克风阵列采集的音频数据组成;
对所述第一多通道音频数据进行解混响处理,得到第二多通道音频数据;
生成针对所述第二多通道音频数据的时频掩码;
根据所述时频掩码,对所述第二多通道音频数据进行波束形成处理,得到第一单通道音频数据;
采用所述第一单通道音频数据,进行音频信号输出。
可选地,所述根据所述时频掩码,对所述第二多通道音频数据进行波束形成处理,得到第一单通道音频数据的步骤包括:
根据所述时频掩码,确定信道传递函数和干扰噪声协方差矩阵;
采用所述信道传递函数和所述干扰噪声协方差矩阵,确定波束权值;
采用所述波束权值,对所述第二多通道音频数据进行波束形成处理,得到第一单通道音频数据。
可选地,所述时频掩码包括目标语音掩码和干扰噪声掩码,所述根据所述时频掩码,确定信道传递函数和干扰噪声协方差矩阵的步骤包括:
采用所述目标语音掩码,生成目标语音协方差矩阵;
采用所述目标语音协方差矩阵,计算得到信道传递函数;
采用所述干扰噪声掩码,计算得到干扰噪声协方差矩阵。
可选地,所述生成针对所述第二多通道音频数据的时频掩码的步骤包括:
生成针对所述第二多通道音频数据中类目标语音数据的第一时频掩码;
根据所述第一时频掩码,确定针对所述第二多通道音频数据的时频掩码。
可选地,所述根据所述第一时频掩码,确定针对所述第二多通道音频数据的时频掩码的步骤包括:
获取所述第一时频掩码对应的类目标语音数据;
结合所述类目标语音数据,生成针对所述第二多通道音频数据中目标语音数据的第二时频掩码;其中,所述类目标语音数据包含所述目标语音数据;
结合所述第一视频掩码、所述第二视频掩码,生成针对所述第二多通道音频数据的时频掩码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911207689.4/2.html,转载请声明来源钻瓜专利网。