[发明专利]模型训练方法、业务处理方法、装置及相关设备有效
申请号: | 201910211389.7 | 申请日: | 2019-03-19 |
公开(公告)号: | CN109978177B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 孙浩博;张红林 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 业务 处理 装置 相关 设备 | ||
1.一种模型训练方法,应用于第一节点设备,其特征在于,包括:
获取目标模型中的目标特征的权重参数;
根据所述目标特征的权重参数确定所述目标特征的当前梯度累积量;所述当前梯度累积量是指当前模型训练与上一次获取并发送近似动量的模型迭代训练之间的梯度累积量;
若所述当前梯度累积量满足预设条件,则获取所述目标特征的近似动量,包括:若所述当前梯度累积量满足预设条件,则获取动量近似算法,根据所述目标特征的历史梯度累积量及所述当前梯度累积量,采用所述动量近似算法计算所述目标特征的近似动量;所述近似动量是根据所述目标特征的梯度累积量进行动量近似计算得到的动量;
向第二节点设备发送所述目标特征的近似动量,使所述第二节点设备采用所述目标特征的近似动量更新所述目标模型;
其中,所述根据所述目标特征的历史梯度累积量及所述当前梯度累积量,采用所述动量近似算法计算所述目标特征的近似动量,包括:调用梯度衰减因子对所述历史梯度累积量进行衰减处理,将衰减处理后的历史梯度累积量与所述当前梯度累积量进行合并处理得到所述目标特征的近似动量。
2.如权利要求1所述的方法,其特征在于,所述权重参数包括第一权重参数;所述获取目标模型中的目标特征的权重参数,包括:
从第二节点设备拉取所述目标模型中的目标特征的第一权重参数。
3.如权利要求1所述的方法,其特征在于,所述权重参数包括第二权重参数;所述获取目标模型中的目标特征的权重参数,包括:
从第二节点设备拉取所述目标模型中的目标特征的第一权重参数;
采用所述目标特征的历史梯度累积量对所述第一权重参数进行更新得到第二权重参数。
4.如权利要求1所述的方法,其特征在于,所述根据所述目标特征的权重参数确定所述目标特征的当前梯度累积量,包括:
根据所述目标特征的权重参数进行梯度计算,得到目标梯度;
合并所述目标特征的历史梯度累积量和所述目标梯度,得到所述目标特征的当前梯度累积量。
5.如权利要求4所述的方法,其特征在于,所述合并所述目标特征的历史梯度累积量和所述目标梯度,得到所述目标特征的当前梯度累积量,包括:
获取梯度学习率;
采用所述梯度学习率对所述目标梯度进行加权得到中间梯度;
合并所述中间梯度和所述目标特征的历史梯度累积量,得到所述目标特征的当前梯度累积量。
6.一种模型训练方法,应用于第二节点设备,其特征在于,包括:
接收第一节点设备发送的目标模型中的目标特征的近似动量,所述目标特征的近似动量是当所述目标特征的当前梯度累积量满足预设条件时,由所述第一节点设备获取并发送的,包括:若所述当前梯度累积量满足预设条件,则获取动量近似算法,根据所述目标特征的历史梯度累积量及所述当前梯度累积量,采用所述动量近似算法计算所述目标特征的近似动量;所述当前梯度累积量根据所述目标特征的权重参数确定;所述当前梯度累积量是指当前模型训练与上一次获取并发送近似动量的模型迭代训练之间的梯度累积量;所述近似动量是根据所述目标特征的梯度累积量进行动量近似计算得到的动量;其中,所述根据所述目标特征的历史梯度累积量及所述当前梯度累积量,采用所述动量近似算法计算所述目标特征的近似动量,包括:调用梯度衰减因子对所述历史梯度累积量进行衰减处理,将衰减处理后的历史梯度累积量与所述当前梯度累积量进行合并处理得到所述目标特征的近似动量;
采用所述目标特征的近似动量更新所述目标模型。
7.如权利要求6所述的方法,其特征在于,在所述接收所述第一节点设备发送的目标模型中的目标特征的近似动量之前,还包括:
响应于第一节点设备的拉取操作,向所述第一节点设备发送目标模型中的目标特征的第一权重参数。
8.如权利要求7所述的方法,其特征在于,所述采用所述目标特征的近似动量更新所述目标模型,包括:
基于长期梯度补偿策略并采用所述目标特征的近似动量更新所述目标模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910211389.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于状态动态感知的多智能体合作学习方法
- 下一篇:一种模型启动方法及装置