[发明专利]联邦学习网络下的模型训练方法及其相关设备有效
申请号: | 202010622524.X | 申请日: | 2020-06-30 |
公开(公告)号: | CN111814985B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 何安珣;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F21/62 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联邦 学习 网络 模型 训练 方法 及其 相关 设备 | ||
本申请实施例属于人工智能领域,应用于智慧社区领域中,涉及一种联邦学习网络下的模型训练方法及其相关设备,建立包括中央客户端和多个节点的联邦学习网络,控制节点接收初始化模型作为本地模型,控制节点使用本地数据训练本地模型获得梯度信息;控制中央客户端根据梯度信息生成全局信息;控制节点根据全局信息获得其他节点的梯度信息,使用梯度信息对当前节点的本地模型进行测试,获得准确率,根据准确率调整全局信息,更新当前节点的本地模型;直至模型收敛,获得结果模型;将节点接收的用户数据输入节点对应的结果模型中,获得结果模型输出的推荐信息。各节点的梯度信息可存储于区块链节点中。本申请实现不同节点的本地模型的个性化训练。
技术领域
本申请涉及人工智能技术领域,尤其涉及联邦学习网络下的模型训练方法及其相关设备。
背景技术
联邦学习(Federated machine learning),是指一种机器学习框架,能有效帮助多个节点在满足数据隐私保护和数据安全的要求下,进行数据使用和机器学习建模。
目前,联邦学习的优化方法有FedSGD,FedAvg,FedProx,FedMA,SCAFFOLD等。但这些方法均是在中央客户端进行模型更新,各参与者最后训练的模型基本一致,无法做到个性化训练;在Non-IID(独立同分布)数据分布上有一定损耗,准确率不够高,以及当有一些节点使用无意义的数据恶意参与模型训练时,难以及时有效地辨别出来,容易受到攻击。
发明内容
本申请实施例的目的在于提出一种联邦学习网络下的模型训练方法及其相关设备,实现不同节点的个性化训练,并降低无意义数据对模型训练的影响。
为了解决上述技术问题,本申请实施例提供一种联邦学习网络下的模型训练方法,采用了如下所述的技术方案:
一种联邦学习网络下的模型训练方法,包括下述步骤:
建立联邦学习网络,所述联邦学习网络包括中央客户端和多个节点,控制每个所述节点接收中央客户端下发的初始化模型,作为本地模型,每个节点分别对本地模型进行多轮更新训练;
直至更新训练后各节点对应的本地模型收敛,各节点分别获得结果模型;
控制所述节点接收用户数据,并输入到所述节点对应的所述结果模型中,获得所述结果模型输出的推荐信息;
其中,在每轮更新训练中,所述更新训练的过程包括:
控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练,获得每个节点的梯度信息,并将所述梯度信息发送至所述中央客户端;
控制所述中央客户端接收并根据所述梯度信息生成全局信息,将所述全局信息发送至各节点;
控制当前节点接收并根据所述全局信息获得其他节点的梯度信息,分别使用每个节点的梯度信息对当前节点的本地模型进行测试,获得准确率,根据所述准确率调整接收到的全局信息,获得调整后的全局信息,并使用所述调整后的全局信息更新当前节点的本地模型;以及
直至完成当前轮全部节点更新训练,判断各节点对应的本地模型是否收敛。
进一步的,根据所述准确率调整接收到的全局信息,获得调整后的全局信息的步骤包括:
根据所述准确率获得每个节点的梯度信息在全局信息中的权重;
将所述权重和梯度信息进行加权求和,获得调整后的全局信息。
进一步的,根据所述准确率获得每个节点的梯度信息在全局信息中的权重的步骤包括:
根据所述准确率计算准确率中间值,其中,所述准确率中间值为各准确率的中位数;
通过如下公式计算各节点的梯度信息的权重:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010622524.X/2.html,转载请声明来源钻瓜专利网。