[发明专利]一种音频数据处理的方法及装置、电子设备、存储介质有效
申请号: | 201911207689.4 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110970046B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 罗大为 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L21/0224;G10L21/0232;G10L21/0264;G10L25/03 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 郑傲日 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 数据处理 方法 装置 电子设备 存储 介质 | ||
1.一种音频数据处理的方法,其特征在于,所述方法包括:
获取第一多通道音频数据;其中,所述第一多通道音频数据由一个或多个麦克风阵列采集的音频数据组成;
对所述第一多通道音频数据进行解混响处理,得到第二多通道音频数据;
生成针对所述第二多通道音频数据的时频掩码;
根据所述时频掩码,对所述第二多通道音频数据进行波束形成处理,得到第一单通道音频数据;
采用所述第一单通道音频数据,进行音频信号输出;
所述采用所述第一单通道音频数据,进行音频信号输出,包括:
对所述第一单通道音频数据进行自适应滤波处理,得到第二单通道音频数据;
采用当前应用类型对应的单通道降噪策略,对所述第二单通道音频数据进行降噪处理,得到第三单通道音频数据;
采用所述第三单通道音频数据,进行音频信号输出。
2.根据权利要求1所述的方法,其特征在于,所述根据所述时频掩码,对所述第二多通道音频数据进行波束形成处理,得到第一单通道音频数据的步骤包括:
根据所述时频掩码,确定信道传递函数和干扰噪声协方差矩阵;
采用所述信道传递函数和所述干扰噪声协方差矩阵,确定波束权值;
采用所述波束权值,对所述第二多通道音频数据进行波束形成处理,得到第一单通道音频数据。
3.根据权利要求2所述的方法,其特征在于,所述时频掩码包括目标语音掩码和干扰噪声掩码,所述根据所述时频掩码,确定信道传递函数和干扰噪声协方差矩阵的步骤包括:
采用所述目标语音掩码,生成目标语音协方差矩阵;
采用所述目标语音协方差矩阵,计算得到信道传递函数;
采用所述干扰噪声掩码,计算得到干扰噪声协方差矩阵。
4.根据权利要求1或2或3所述的方法,其特征在于,所述生成针对所述第二多通道音频数据的时频掩码的步骤包括:
生成针对所述第二多通道音频数据中类目标语音数据的第一时频掩码;
根据所述第一时频掩码,确定针对所述第二多通道音频数据的时频掩码。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一时频掩码,确定针对所述第二多通道音频数据的时频掩码的步骤包括:
获取所述第一时频掩码对应的类目标语音数据;
结合所述类目标语音数据,生成针对所述第二多通道音频数据中目标语音数据的第二时频掩码;其中,所述类目标语音数据包含所述目标语音数据;
结合所述第一时频掩码、所述第二时频掩码,生成针对所述第二多通道音频数据的时频掩码。
6.根据权利要求1所述的方法,其特征在于,所述对所述第一多通道音频数据进行解混响处理,得到第二多通道音频数据的步骤包括:
获取解混响参数;
采用所述解混响参数,对所述第一多通道音频数据进行解混响处理,得到第二多通道音频数据;
所述方法还包括:
采用所述第一单通道音频数据和/或,所述第二单通道音频数据和/或,所述第三单通道音频数据,迭代更新所述解混响参数。
7.根据权利要求1所述的方法,其特征在于,在所述对所述第一多通道音频数据进行解混响处理,得到第二多通道音频数据的步骤之前,所述方法还包括:
确定所述第一多通道音频数据中音频数据的相关程度;
按照所述相关程度,对所述第一多通道音频数据中音频数据进行对齐处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911207689.4/1.html,转载请声明来源钻瓜专利网。