[发明专利]联邦学习中基于反向拍卖的隐私保护激励机制训练方法在审
申请号: | 202210109376.0 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114493808A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 吴岳洲;潘嵘 | 申请(专利权)人: | 中山大学 |
主分类号: | G06Q30/08 | 分类号: | G06Q30/08;G06F21/62;G06K9/62;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 禹小明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联邦 学习 基于 反向 拍卖 隐私 保护 激励机制 训练 方法 | ||
1.一种联邦学习中基于反向拍卖的隐私保护激励机制训练方法,对于包含全局分类器的中央服务器与若干包含提取器、分类器、判别器以及生成器的联邦学习参与者,其特征在于,在各轮联邦学习中:
所述联邦学习参与者不会向所述中央服务器发送提取器,而是使用各自的生成器拟合提取器的输出,供所述中央服务器进行训练;
所述中央服务器根据各联邦学习参与者提供的投标价以及生成器,结合反向拍卖的方式对各联邦学习参与者的分类器进行筛选;通过对筛选结果进行融合,更新全局分类器。
2.根据权利要求1所述的联邦学习中基于反向拍卖的隐私保护激励机制训练方法,其特征在于,在各轮联邦学习中,所述联邦学习参与者分别从所述中央服务器接收全局分类器更新替换本地的分类器后,以训练数据x以及类标签y,通过以下步骤进行提取器以及分类器的训练:
S11,将所述训练数据x输入到所述提取器中,获得真实特征freal;
S12,将所述真实特征freal输入到所述分类器中,获得预测类标签ypred;
S13,根据所述预测类标签ypred与类标签y,获得分类任务损失值Ltask;
S14,以最小化任务损失值Ltask为目标,使用反向传播算法更新所述提取器以及分类器的参数。
3.根据权利要求2所述的联邦学习中基于反向拍卖的隐私保护激励机制训练方法,其特征在于,在各轮联邦学习中,在完成提取器以及分类器的训练后,所述联邦学习参与者通过以下步骤进行判别器以及生成器的训练:
S15,将所述类标签y以及预置的随机噪声z输入到所述生成器中,获得伪特征ffake;
S16,将所述真实特征freal以及伪特征ffake输入到所述判别器中,获得预测域标签dpred;
S17,根据所述预测域标签dpred,获得域任务损失值Ldom;
S18,使用反向传播算法,以最小化所述域任务损失值Ldom为目标更新所述判别器的参数,以最大化所述域任务损失值Ldom为目标更新所述生成器的参数。
4.根据权利要求3所述的联邦学习中基于反向拍卖的隐私保护激励机制训练方法,其特征在于,在各轮联邦学习中,在完成判别器以及生成器的训练后,所述联邦学习参与者将经过本轮联邦学习训练后的生成器以及预设的投标价发送到所述中央服务器参与竞标:若竞标成功,则将经过本轮联邦学习训练后的分类器发送到所述中央服务器进行融合,结束本轮联邦学习;否则直接结束本轮联邦学习。
5.根据权利要求3或4所述的联邦学习中基于反向拍卖的隐私保护激励机制训练方法,其特征在于,在各轮联邦学习中,所述中央服务器通过以下方式进行训练:
S21,获取各联邦学习参与者i提供的生成器Gi以及投标价bi;
S22,遍历所述类标签y,将所述类标签y以及随机噪声z分别输入到各生成器Gi中,获得生成器Gi对应所述类标签y的特征均值fi;
S23,运用聚类算法获得所述特征均值fi到所属类中心的距离di,以作为生成器Gi的价值;
S24,根据的值,由小到大对所述联邦学习参与者i进行排序,将前k个联邦学习参与者筛选为竞标成功者;
S25,从所述竞标成功者处获取分类器进行融合,更新全局分类器。
6.根据权利要求5所述的联邦学习中基于反向拍卖的隐私保护激励机制训练方法,其特征在于,所述步骤S23采用无监督聚类算法K-means获得所述特征均值fi到所属类中心的距离di。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210109376.0/1.html,转载请声明来源钻瓜专利网。