[发明专利]一种基于版本控制的分布式机器学习模型更新方法在审
申请号: | 202011555400.0 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112488324A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 郑嘉琦;韩宏健;陈贵海 | 申请(专利权)人: | 南京大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/08 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 陈月菊 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 版本 控制 分布式 机器 学习 模型 更新 方法 | ||
1.一种基于版本控制的分布式机器学习模型更新方法,其特征在于,所述更新方法包括以下步骤:
S10,本地计算:工作节点基于本地参数以及其版本进行梯度计算和版本传递,随后发送包含版本信息的push请求向服务器节点通信;
S20,梯度通信:参数服务器将根据push请求的版本信息判断所属工作节点的通信合法性,并进行相应的操作;
S30,全局更新:参数服务器收集梯度,并根据强化学习方法所得到的控制信息控制全局参数更新和通信;
S40,参数通信:参数服务器根据步骤S20和步骤S30的控制结果发送当前最新全局参数以及版本信息,接收到的工作节点进行本地参数以及版本的更新;
重复以上过程直到满足停止条件:分布式系统的收敛所消耗的时间小于预设时间阈值。
2.根据权利要求1所述的基于版本控制的分布式机器学习模型更新方法,其特征在于,步骤S10中,所述本地计算的过程包括如下步骤:
S11,工作节点将根据本地参数w和版本V(w)计算梯度以及梯度的版本:假设该工作节点m所使用的批大小为n,将参数的版本传递给工作节点V(m)←V(w),随后根据本地数据(xi,yi)和参数w计算出数据相关梯度并进行本地梯度更新:
S12,工作节点m将梯度的版本信息V(m)压入push请求中,请求与参数服务器通信梯度和参数。
3.根据权利要求1所述的基于版本控制的分布式机器学习模型更新方法,其特征在于,步骤S20中,所述梯度通信包括如下步骤:
S21,参数服务器根据收集到的push请求中的版本信息,结合工作节点的梯度版本与参数服务器当前的全局参数版本差距进行合法性检查:若差距大于第一差距阈值则判定为曾经离线工作节点,发送丢弃回应;若差距小于第二差距阈值则判定为较快工作节点,发送跳过回应;否则,判定为正常工作节点,发送更新回应;所述第一差距阈值大于第二差距阈值;
S22,参数服务器将与步骤S21中判断为正常的工作节点进行参数通信以收集工作节点梯度。
4.根据权利要求1所述的基于版本控制的分布式机器学习模型更新方法,其特征在于,步骤S30中,所述全局更新包括如下步骤:
S31,参数服务器根据步骤S20的判断结果进行控制信息更新,根据更新后的控制信息和当前的控制阈值控制参数的更新和通信;
S32,参数服务器采用强化学习的方法生成自适应的控制阈值并更新当前控制阈值τ。
5.根据权利要求4所述的基于版本控制的分布式机器学习模型更新方法,其特征在于,步骤S31中,所述参数服务器根据步骤S20的判断结果进行控制信息更新,根据更新后的控制信息和当前的控制阈值控制参数的更新和通信的过程包括如下步骤:
S311,参数服务器根据步骤S20的判断结果进行版本延迟信息更新以及等待队列更新:对于已接收push请求的工作节点i,将其延迟信息di写为0,等待队列信息qi写为1;
S312,参数服务器根据步骤S311中的版本延迟信息以及当前版本阈值τ判断是否进行全局更新以及参数通讯:若满足则进行全局参数和版本的更新:并且将更新后的参数和版本同在等待队列中的工作节点进行通信,否则将当前工作节点置于等待状态。
6.根据权利要求5所述的基于版本控制的分布式机器学习模型更新方法,其特征在于,更新过程中所采用的数据结构和操作为
7.根据权利要求4所述的基于版本控制的分布式机器学习模型更新方法,其特征在于,步骤S32中,所述参数服务器采用强化学习的方法生成自适应的控制阈值并更新当前控制阈值τ的过程包括如下步骤:
S321,参数服务器定期根据当前的控制阈值τ、收集到的版本延迟信息以及其信息熵根据奖赏函数计算出当前状态下的奖赏,进行Q表的更新;
S322,参数服务器采用强化学习算法产生新的动作,根据新的动作转移至新的状态,并根据该状态更新当前控制阈值τ用作后续的控制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011555400.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种地下空间建构筑物控水系统及其施工方法
- 下一篇:断路器