[发明专利]一种针对联邦学习通信开销的优化处理方法及装置在审
申请号: | 202210023353.8 | 申请日: | 2022-01-10 |
公开(公告)号: | CN114548421A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 刘洋;丁文伯;赵子号;毛钰竹;黄绍伦 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;H04L41/0823;H04L41/142;H04L41/16 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王宇杨 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 联邦 学习 通信 开销 优化 处理 方法 装置 | ||
1.一种针对联邦学习通信开销的优化处理方法,应用于中心服务器,其特征在于,包括:
将初始全局模型分发到本地客户端,并获得所述本地客户端基于预设的自适应梯度量化模型得到的当前轮次的目标量化等级;所述目标量化等级用于对所述本地客户端在当前轮次上传的梯度进行量化;
基于预设的惰性梯度聚合模型,确定是否获取所述本地客户端在当前轮次对应的量化梯度;其中,所述量化梯度是所述本地客户端基于所述目标量化等级对当前轮次上传的梯度进行量化得到的;
对所述量化梯度进行聚合处理,并根据聚合结果更新所述初始全局模型,得到下一轮次对应的目标全局模型。
2.根据权利要求1所述的针对联邦学习通信开销的优化处理方法,其特征在于,基于预设的惰性梯度聚合模型,确定是否获取所述本地客户端在当前轮次对应的量化梯度,具体包括:
基于预设的惰性梯度聚合模型判断当前轮次对应的量化梯度与上一轮次对应的量化梯度的差值是否大于或等于预设的梯度范围阈值,若是,则确定获取所述本地客户端在当前轮次对应的量化梯度。
3.根据权利要求1所述的针对联邦学习通信开销的优化处理方法,其特征在于,对所述量化梯度进行聚合处理,并根据聚合结果更新所述初始全局模型,得到下一轮次对应的目标全局模型,具体包括:
基于预设的量化梯度聚合模型对所述量化梯度进行聚合处理,得到梯度下降之后对应的聚合结果;
根据聚合结果更新当前训练轮次对应的所述初始全局模型,得到下一训练轮次对应的目标全局模型。
4.根据权利要求1所述的针对联邦学习通信开销的优化处理方法,其特征在于,所述自适应梯度量化模型对应的公式(1)如下:
式中,表示第m个本地客户端在第k轮次的目标量化等级,其中表示量化等级;b0表示每个本地客户端对应的初始量化等级;表示自适应过程,是模型训练中自适应得到的,其中表示第m个本地客户端在第1轮次对应的量化梯度,表示第m个本地客户端在第k轮次对应的量化梯度,表示第m个本地客户端在第0轮次实际上传的量化梯度;表示第m个本地客户端在第k-1轮次实际上传的量化梯度;m表示第m个本地客户端。
5.根据权利要求2所述的针对联邦学习通信开销的优化处理方法,其特征在于,所述惰性梯度聚合模型对应的公式(2)如下:
式中,表示第m个本地客户端在第k轮次用目标量化等级去量化一个梯度得到的一个量化梯度;表示第m个本地客户端在第k-1轮次实际使用的量化梯度去量化一个梯度得到的一个真实梯度;用于衡量第m个本地客户端第k轮次更新量的差值;表示梯度范围阈值,θ是全局模型的参数;D表示总共的轮次;表示真实梯度和量化梯度的差值;表示量化后的量化梯度与原始梯度的差距;ξd和α是两个超参数,其中ξd为量化梯度的惩罚项。
6.一种针对联邦学习通信开销的优化处理方法,应用于本地客户端,其特征在于,包括:
获取中心服务器分发的初始全局模型;
基于预设的自适应梯度量化模型确定当前轮次的目标量化等级,并基于所述目标量化等级对当前轮次待上传的梯度进行量化,得到当前轮次对应的量化梯度;
将所述当前轮次对应的量化梯度上传到中心服务器,以在所述中心服务器中实现对所述量化梯度的聚合处理。
7.一种针对联邦学习通信开销的优化处理装置,其特征在于,包括:
量化等级自适应确定单元,用于将初始全局模型分发到本地客户端,并获得所述本地客户端基于预设的自适应梯度量化模型得到的当前轮次的目标量化等级;所述目标量化等级用于对所述本地客户端在当前轮次上传的梯度进行量化;
惰性梯度聚合处理单元,用于基于预设的惰性梯度聚合模型,确定是否获取所述本地客户端在当前轮次对应的量化梯度;其中,所述量化梯度是所述本地客户端基于所述目标量化等级对当前轮次上传的梯度进行量化得到的;
量化梯度聚合处理单元,用于对所述量化梯度进行聚合处理,并根据聚合结果更新所述初始全局模型,得到下一轮次对应的目标全局模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210023353.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:银行分级方法及装置
- 下一篇:一种波浪能发电机输出切换电路