[发明专利]一种面向异质统计的分簇联邦学习方法在审
申请号: | 202310060893.8 | 申请日: | 2023-01-17 |
公开(公告)号: | CN115952860A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 左方;高铭远;刘家萌 | 申请(专利权)人: | 河南大学 |
主分类号: | G06N3/098 | 分类号: | G06N3/098;G06F18/23213;G06F18/241;G06F18/22 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 张立强 |
地址: | 475004 河南省开封市金明区*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 统计 联邦 学习方法 | ||
1.一种面向异质统计的分簇联邦学习方法,其特征在于,包括:
步骤1,构建边缘节点分布分类器;
步骤2,确定边缘节点分簇的衡量指标;
步骤3,确定节点集群的分簇方法;
步骤4,使用分簇方法对边缘节点进行分簇;
步骤5,服务器初始化全局模型,并发送模型到每个节点集群的头结点;
步骤6,边缘节点接收到模型后在本地数据集上进行本地训练并更新模型,并将更新后的模型发送到簇内下一个节点进行训练,直至每一个簇内节点全部完成训练,上传更新后的模型到服务器;
步骤7,服务器接收所有簇更新后的模型后进行加权平均,更新全局模型;
步骤8,重复步骤6、步骤7,直至全局模型收敛。
2.根据权利要求1所述的一种面向异质统计的分簇联邦学习方法,其特征在于,所述步骤1包括:
把全局模型fθ分成一个深度特征提取器和一个分类器其中θ=(θfeat,θclf)是全局模型的参数集;
在联邦学习正式开始前,利用预训练阶段来估计参与训练的边缘节点上的数据分布,在此期间,每个边缘节点k从相同的随机初始化θ0开始,在其本地数据集上训练e个回合,更新模型为
分别基于本地分类器的参数ψclf或其在服务器端公共数据集上的预测ψconf构建边缘节点分布分类器;
在服务器端,使用分类器,根据边缘节点更新后的模型获得该节点的数据分布的估计值
3.根据权利要求2所述的一种面向异质统计的分簇联邦学习方法,其特征在于,所述步骤2包括:
从边缘节点k的数据分布近似值开始,从具有不同分布的节点中建立类似的节点集群,最小化节点集群间的距离,同时最大化节点集群内的距离;
使用余弦和欧氏距离来比较客户分类器的权重,使用作为置信度向量给出的实际概率分布的形式,同时采用KL散度作为衡量指标。
4.根据权利要求1所述的一种面向异质统计的分簇联邦学习方法,其特征在于,所述分簇方法包括:
策略1:客户被随机分配到节点集群中,直到满足定义的停止标准;
策略2:首先,使用K-means方法获得NS个同质聚类;然后,通过每次从每个聚类中迭代的提取一个边缘节点形成所有节点集群,直到每个节点集群S中的样本数和边缘节点KS≤kS,max;
策略3:随机选择一个边缘节点ki分配给当前的节点集群S,i∈[K];然后,选择第二个边缘节点kj,使ki和kj之间的距离达到最大,即不断重复该过程,最后通过迭代最大化达到既定的最大边缘节点数KS,max和最小样本数其中τ为分簇的衡量指标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310060893.8/1.html,转载请声明来源钻瓜专利网。