[发明专利]语音模型的训练方法、装置、设备及计算机可读存储介质在审
申请号: | 202210067196.0 | 申请日: | 2022-01-20 |
公开(公告)号: | CN114399995A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 唐凯 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 赵翠萍;胡春光 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 模型 训练 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种语音模型的训练方法,其特征在于,所述方法包括:
获取用于语音识别的初始语音模型,所述初始语音模型基于携带样本标签的第一语音样本训练得到;
通过所述初始语音模型,对第二语音样本进行语音识别,得到识别结果,并将所述识别结果作为所述第二语音样本的伪标签;
基于携带所述伪标签的第二语音样本、携带所述样本标签的第一语音样本,对所述初始语音模型进行联合训练,得到目标语音模型。
2.根据权利要求1所述的方法,其特征在于,所述基于携带所述伪标签的第二语音样本、携带所述样本标签的第一语音样本,对所述初始语音模型进行联合训练,得到目标语音模型,包括:
通过所述初始语音模型,对联合训练样本集合中的训练样本进行预测,得到预测结果;其中,所述联合训练样本集合包括:携带所述样本标签的第一语音样本及携带所述伪标签的第二语音样本;
获取所述预测结果与所述训练样本的标签之间的差异,并基于所述差异确定目标损失函数的值;
基于所述训练样本及所述预测结果进行对比学习,以确定所述训练样本对应的对比损失函数的值;
结合所述目标损失函数的值以及所述对比损失函数的值,更新所述初始语音模型的模型参数,得到目标语音模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述训练样本及所述预测结果进行对比学习,以确定所述训练样本对应的对比损失函数的值,包括:
基于所述训练样本,构建相应的正样本以及负样本;
基于所述正样本及所述预测结果,确定所述对比损失函数的值作为所述正样本与所述训练样本之间的第一损失;
基于所述负样本及所述预测结果,确定所述对比损失函数的值作为所述负样本与所述训练样本之间的第二损失;
基于所述第一损失与所述第二损失,确定所述训练样本对应的对比损失函数的值。
4.根据权利要求3所述的方法,其特征在于,所述基于所述训练样本,构建相应的正样本以及负样本,包括:
对所述训练样本进行特征提取,得到所述训练样本对应的初始语音特征;
对所述初始语音特征进行离散化处理,得到目标语音特征作为所述训练样本对应的正样本;
生成对应所述初始语音特征的噪声特征,作为所述训练样本对应的负样本。
5.根据权利要求2所述的方法,其特征在于,所述对联合训练样本集合中的训练样本进行预测,得到预测结果之后,所述方法还包括:
获取特征交换比例;
基于所述特征交换比例,将所述预测结果中部分特征与所述训练样本中部分特征进行交换,得到交换后的预测结果及交换后的训练样本;
其中,所述交换后的预测结果,用于结合所述训练样本的标签确定所述目标损失函数的值;
所述交换后的训练样本,用于结合所述预测结果进行对比学习,以确定所述训练样本对应的对比损失函数的值。
6.根据权利要求2所述的方法,其特征在于,所述结合所述目标损失函数的值以及所述对比损失函数的值,更新所述初始语音模型的模型参数,得到目标语音模型,包括:
分别获取所述目标损失函数的权重及所述对比损失函数的权重;
基于所述目标损失函数的权重及所述对比损失函数的权重,对所述目标损失函数的值以及所述对比损失函数的值进行加权求和,得到加权求和结果;
基于所述加权求和结果,更新所述初始语音模型的模型参数,得到目标语音模型。
7.根据权利要求1所述的方法,其特征在于,所述对所述初始语音模型进行联合训练,得到目标语音模型之后,所述方法还包括:
获取携带语音标签的第三语音样本;
基于所述第三语音样本,对所述目标语音模型进行训练,以更新所述目标语音模型的模型参数。
8.根据权利要求1或7所述的方法,其特征在于,所述方法还包括:
获取待识别语音数据;
将所述待识别语音数据输入至所述目标语音模型,输出识别得到的语音结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210067196.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于人群分析的无人售货机选品方法及系统
- 下一篇:一种紫外全介质超透镜组