[发明专利]一种基于堆栈自动编码器的联邦学习方法、装置及系统在审
申请号: | 202111155779.0 | 申请日: | 2021-09-29 |
公开(公告)号: | CN113935462A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 樊昕晔;王鹏;贾雪丽;李钰;王义文;田江;向小佳;丁永建;李璠 | 申请(专利权)人: | 光大科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N20/20;G06K9/62;G06F21/60;G06V10/774 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 张秀英 |
地址: | 100040 北京市石景*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 堆栈 自动 编码器 联邦 学习方法 装置 系统 | ||
本发明提供了一种基于堆栈自动编码器的联邦学习方法、装置及系统,其中,该方法包括:多个子节点分别通过堆栈自动编码器对目标图像数据进行加密,得到加密后的图像数据,将该加密后的图像数据发送给该中心节点;该中心节点根据该多子节点的加密后的图像数据对图像分类模型进行训练,可以解决相关技术中横向联邦学习在训练模型时,需要各子节点均保持在线,任意一方网络出现问题均会导致训练失败,且数据容易泄露的问题,使用堆栈自动编码器对各子节点的数据进行加密,中心节点无法获得堆栈自动编码器的参数,故无法基于加密后的数据推断出对应的原始数据,保证了数据的安全,一定程度上提升了联邦学习的效果和效率。
技术领域
本发明涉及数据处理领域,具体而言,涉及一种基于堆栈自动编码器的联邦学习方法、装置及系统。
背景技术
传统横向联邦学习下的模型训练,多个节点共同训练一个模型时,数据质量显得尤为重要。但数据均存在不同程度的噪声,这部分噪声会干扰模型效果,延缓模型训练速率。传统横向联邦学习目前无法规避噪声对于模型的不良影响。
当模型需要很多轮的迭代时,这会产生大量的通信开销。因为每轮迭代都需要各节点间传递参数,复杂的模型参数量巨大,且经过加密处理后的参数,所占的内存空间会变得更大。传统横向联邦学习只能提升机器性能,以应对大量参数传递带来的巨大通信开销。传统横向联邦学习在训练模型时,需要各节点均保持在线,任意一方网络出现问题均会导致训练失败。
针对相关技术中横向联邦学习在训练模型时,需要各子节点均保持在线,任意一方网络出现问题均会导致训练失败,且数据容易泄露的问题,尚未提出解决方案。
发明内容
本发明实施例提供了一种基于堆栈自动编码器的联邦学习方法、装置及系统,可以解决相关技术中横向联邦学习在训练模型时,需要各子节点均保持在线,任意一方网络出现问题均会导致训练失败,且数据容易泄露的问题。
根据本发明的一个实施例,提供了一种基于堆栈自动编码器的联邦学习方法,应用于子节点,包括:
通过堆栈自动编码器对目标图像数据进行加密,得到加密后的图像数据;
将所述加密后的图像数据发送给中心节点,以使所述中心节点根据多个所述子节点的加密后的图像数据对图像分类模型进行训练。
可选地,通过堆栈自动编码器对目标图像数据进行加密,得到加密后的图像数据包括:
根据预设数量的图像数据训练所述堆栈自动编码器,得到训练好的自动编码器;
根据所述自动编码器提取代表所述目标图像数据的核心特征的编码数组,其中,所述加密后的图像数据为所述编码数组。
可选地,根据所述自动编码器提取代表所述目标图像数据的核心特征的编码数组包括:
将所述目标图像数据输入所述自动编码器;
通过所述自动编码器计算所述目标图像数据中每个图像数据的均方误差;
根据所述均方误差过滤所述目标图像数据中的异常数据,得到所述编码数组。
可选地,根据所述均方误差过滤所述目标图像数据中的异常数据,得到所述编码数组包括:
将所述每个图像数据的所述均方误差与预先设置的阈值进行对比,得到对比结果;
将所述目标图像数据中所述对比结果为大于预先设置的阈值的图像数据确定为异常数据;
对所述异常数据进行过滤。
根据本发明的另一个实施例,还提供了一种基于堆栈自动编码器的联邦学习方法,应用于中心节点,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于光大科技有限公司,未经光大科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111155779.0/2.html,转载请声明来源钻瓜专利网。