[发明专利]一种非独立同分布数据场景下的联邦学习隐私保护方法在审
申请号: | 202211081816.2 | 申请日: | 2022-08-31 |
公开(公告)号: | CN115374479A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 张轶凡;张一晋;马川 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 南京鼎傲知识产权代理事务所(普通合伙) 32327 | 代理人: | 刘蔼民 |
地址: | 210094 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 独立 分布 数据 场景 联邦 学习 隐私 保护 方法 | ||
本发明属于隐私保护技术领域,具体涉及一种非独立同分布数据场景下的联邦学习隐私保护方法。本发明将联邦学习模型与生成对抗神经网络相结合,解决了联邦学习在非独立同分布场景下训练难收敛的问题,降低联邦学习框架内各终端的通信损耗,可以在联邦各终端算力较低的情况下提高机器利用率和学习效率。本发明所使用的ViTGAN生成对抗网络生成的近似真实数据分布的虚假数据,能够满足本地用户的隐私保证,加快联邦学习的收敛速度和降低训练通信负载,提升联邦学习训练好的全局模型和测试精度,同时解决联邦学习易受到推理攻击的问题。
技术领域
本发明涉及联邦学习隐私保护技术领域,尤其是涉及一种基于非独立同分布数据场景下的联邦学习隐私保护方法。
背景技术
随着大数据、人工智能、云计算等新技术在各行业不断深入应用,全球数据呈现爆发增长、海量聚集的特点,数据的价值愈发凸显。数据作为生产要素的流通交易,面临确权和隐私保护两大关键难题。数据本质上是信息,不具备独享性或专享性,多数人可同时拥有。大数据时代,与个人有关的信息传播边际成本微乎其微,能够迅速传遍整个世界,这种低成本使得数据保护面临特殊困难。目前,公司和组织等越来越多地收集用户的详细信息,一方面,能够通过这些属于不同组织的原始数据抽取出有价值的信息,这些信息能通过机器学习技术来提升产品、服务和福利的质量;另一方面,在分布式场景下会存在潜在的滥用和攻击行为,这对数据隐私和安全带来了极大地挑战。传统从用户端收集数据整合后训练机器学习模型的方式被担忧可能会侵犯隐私。
联邦学习为解决用户间隐私问题而产生,能够在尽量不影响效率的情况下实现隐私保护的联合机器学习。相较于将所有的本地数据发送给中央模型,联邦学习将模型分配给每一个设客户端去协助各设备进行模型的训练。在联邦学习中,服务器负责将所有设备终端中的模型融合成一个全局模型,以及将全局模型下发给所有的终端设备。在模型训练过程中,各终端设备只将本地训练得到的模型更新信息上传至服务器用以进行模型权重的聚合,从而能够实现各终端设备本地数据的隐私保护以及降低系统整体的通信开销。
尽管联邦学习在各设备终端的协作机器学习中有很大的应用价值,但是它极大地受困于各设备终端的数据分布不一致的缺点。当各终端设备收取的数据分布属于独立同分布时,由于各设备终端中的本地模型训练得到的随机梯度是对整体梯度的无偏估计,所以传统的联邦学习能够表现出卓越的性能。但是当系统中各设备收取的数据分布为偏斜的非独立同分布时,各设备终端中的模型在训练中就会向不同的方向收敛优化。由于各设备终端梯度发散的现象,在这种数据分布的情况下,传统联邦学习的精度会剧烈下降。另外,相较于在独立同分布的数据场景下,当各终端设备中的数据属于非独立同分布时,传统的联邦学习需要更多的信息沟通轮数达到全局模型的收敛,这也会给设备贫瘠的网络带宽增加巨大的压力。
因此,需要一种新的联邦学习隐私保护方法来进一步提升隐私保护的效果,从而达到更佳的性能。
发明内容
鉴于上述,本发明的目的在于提供一种非独立同分布数据场景下的联邦学习隐私保护方法,在保障用户数据安全的基础上,进一步提升特定场景下联邦学习系统的实用性和有效性,同时解决联邦学习系统的通信效率及损耗问题。
为实现上述发明目的,实施例提供了一种非独立同分布数据场景下的联邦学习隐私保护方法,包括ViTGAN网络、多个客户端和中心服务器,每个客户端与中心服务器建有通信通道,具体步骤为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211081816.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加氢反应的尾气氢的处理方法
- 下一篇:具有磁性分片机构的全自动上料装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置