[发明专利]全局模型的训练方法、装置及电子设备在审
申请号: | 202310118884.X | 申请日: | 2023-01-31 |
公开(公告)号: | CN116361642A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 霍炎;范新;高青鹤;荆涛;高勃;朱明皓;王晓轩;卢燕飞;周春月;王光宇 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/24;G06N3/0475;G06N3/098 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 金含 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 全局 模型 训练 方法 装置 电子设备 | ||
本申请提供一种全局模型的训练方法、装置及电子设备,应用于联邦学习系统,所述联邦学习系统包括服务器和多个分布式设备,在所述服务器中部署全局模型,分别在每个分布式设备中部署局部模型,所述全局模型和每个局部模型均设置有特征提取器、鉴别器和分类器,所述特征提取器和所述鉴别器组成生成对抗网络;所述方法包括利用所述服务器对所述全局模型进行参数初始化;利用所述服务器和所述多个分布式设备对经过所述参数初始化的全局模型进行多轮迭代训练,直至所述全局模型满足收敛条件为止,得到训练完成的全局模型,解决了现有技术中联邦学习的不同分布式设备的数据具有异质性的技术问题,提升了联邦学习的性能目的。
技术领域
本申请涉及全局模型技术领域,尤其涉及一种全局模型的训练方法、装置及电子设备。
背景技术
随着工业物联网的发展,各种各样的设备产生了大量的数据。机器学习通过数据收集和模型训练可以有效地利用数据,从而指导工业实践。在传统集中式的机器学习中,中心节点需要收集数据用于模型训练,这样不仅造成巨大的通信开销,也会暴露数据隐私。于是,联邦学习被提出来实现在不共享数据的情况下的分布式机器学习。在联邦学习过程中,各分布式设备不传输本地数据,仅仅传输训练好的局部模型参数到服务器。服务器通过接收各分布式设备发来的局部模型参数确定全局模型参数,然后将全局模型参数反馈给各分布式设备用于下一轮训练。
然而,各分布式设备中的数据是非独立同分布的,比如不同企业的数据具有异质性。数据的异质性使得局部模型参数在一定程度上偏离全局模型参数,使得反馈到各分布式设备的全局模型参数不具有适用性,不利于各分布式设备的训练。各分布式设备中的数据异质性,使得各分布式设备的泛化能力不佳,不同分布式设备的模型的权重分散性较高,导致联邦学习的性能急剧下降。
发明内容
有鉴于此,本申请的目的在于提出一种全局模型的训练方法、装置及电子设备,以克服现有技术中全部或部分不足。
基于上述目的,本申请提供了一种全局模型的训练方法,应用于联邦学习系统,所述联邦学习系统包括服务器和多个分布式设备,在所述服务器中部署全局模型,分别在每个分布式设备中部署局部模型,所述全局模型和每个局部模型均设置有特征提取器、鉴别器和分类器,所述特征提取器和所述鉴别器组成生成对抗网络;包括:利用所述服务器对所述全局模型进行参数初始化;利用所述服务器和所述多个分布式设备对经过所述参数初始化的全局模型进行多轮迭代训练,直至所述全局模型满足收敛条件为止,得到训练完成的全局模型。
可选地,所述利用所述服务器和所述多个分布式设备对经过所述参数初始化的全局模型进行多轮迭代训练,包括:对于所述多轮迭代训练中的每一轮迭代执行如下操作:利用所述服务器将所述全局模型的当前全局模型参数发送至每个分布式设备;基于所述当前全局模型参数和每个分布式设备的本地数据集,利用每个分布式设备对与其对应的局部模型的特征提取器和分类器进行训练,以得到第一特征提取器参数和分类器参数;基于所述当前全局模型参数、所述本地数据集和所述第一特征提取器参数,利用每个分布式设备对与其对应的局部模型的鉴别器进行训练,以得到鉴别器参数;基于所述本地数据集、所述第一特征提取器参数和所述鉴别器参数,利用每个分布式设备对与其对应的局部模型的特征提取器进行训练,以得到第二特征提取器参数;分别利用每个分布式设备将与其关联的所述分类器参数、所述鉴别器参数和所述第二特征提取器参数发送至所述服务器;基于多个所述分类器参数、多个所述鉴别器参数和多个所述第二特征提取器参数,利用所述服务器对所述当前全局模型参数进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310118884.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于数据流谱的流量验证方法及装置
- 下一篇:苜蓿的养殖废水灌溉方法