[发明专利]基于云雾架构纵向联邦学习的体医数据融合隐私保护方法在审
申请号: | 202310565639.3 | 申请日: | 2023-05-19 |
公开(公告)号: | CN116595584A | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 王新建;武洛生;杨建设;胡婕婷;郑敏;穆鹏远;朱元利;路铭达 | 申请(专利权)人: | 西安体育学院 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G16H20/40;G16H40/20;G06N20/00 |
代理公司: | 西安文盛专利代理有限公司 61100 | 代理人: | 佘文英 |
地址: | 710065 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 云雾 架构 纵向 联邦 学习 数据 融合 隐私 保护 方法 | ||
1.一种基于云雾架构纵向联邦学习的体医数据融合隐私保护方法,其特征是该方法包括以下步骤:
步骤一,收集参与联邦学习的各参与方的原始数据并进行相关处理,具体过程如下:
步骤1.1,首先,运动指导中心和医院收集参与联邦学习的各参与方的原始数据,并对原始数据进行数据清洗,进行数据清洗操作后,为了使数据更加适合机器学习算法的使用,需要对数据进行预处理,将不同参与方的数据格式、标签、值域进行统一,形成标准化数据格式,消除量纲差异和异常值的影响,确保不同参与方的数据具有相似的分布和特征,从而提高联邦学习的效果和可靠性;
步骤1.2,然后通过差分隐私技术向经过预处理后的数据中添加随机噪声,将隐私特征切分出来并加密,保护原始数据的隐私性,从而防止个人敏感信息的泄露,需要针对数值型的数据和非数值型数据采用不同的方法分别进行;
步骤1.3,最后,将清洗和预处理后的数据存储到数据库或文件系统中,形成本地数据集,以便后续分析和模型训练时调用,其中运动指导中心和医院分别拥有本地数据集Dcenter和Dhispital;
步骤二,运动指导中心和医院分别对各自的本地数据集进行模型训练,获得本地模型;
具体过程如下:
步骤2.1,运动指导中心和医院双方抽样选取参与联邦学习的参与方用户数据,进行加密ID匹配对齐,得到双方共有的用户ID列表,这些机构的数据将用于联邦学习;
步骤2.2,然后双方将这些用户数据进行同态加密,使用纵向联邦学习的机制在本地数据集上训练本地模型;
步骤2.3,在本地模型训练的过程中,需要根据差分隐私的要求在梯度更新算法中添加噪声,以保护数据隐私,同时,在更新模型参数时,给每个参与方的梯度添加相应的噪声来保护数据隐私,每个参与方的梯度更新公式可以表示为:
其中,Δwt表示参数的更新量,n表示训练集中的样本数,yi表示样本i的标签,xi表示样本i的特征,ft表示当前模型的预测函数,wt表示当前模型的参数,λ表示正则化参数,σt表示标准差,表示均值为0,方差为的分布噪声;
步骤三,运动指导中心和医院双方将本地模型上传至联邦服务器;上传时在本地模型的参数中添加噪声,并将加噪后的参数发送至联邦服务器进行参数的更新;
步骤四,联邦服务器对上传的本地模型进行纵向联邦学习,生成全局模型,具体过程如下:
在纵向联邦学习过程中,联邦服务器需要将所有参与方的本地模型进行聚合来更新全局模型参数,以此提高模型的准确性和性能,在更新全局模型参数的过程中,为了保护每个参与方的隐私,使用差分隐私技术添加随机噪声来保护本地模型的隐私;
步骤五,运动指导中心和医院将本地数据集输入全局模型,并对全局模型进行训练,然后使用训练好的全局模型来对数据进行预测,获得预测结果;
步骤六,运动指导中心和医院将预测结果上传至联邦服务器;
每个机构在上传预测结果之前,需要对预测结果进行差分隐私处理,即每个机构上传带有随机噪声的预测结果至联邦服务器,而不是原始的预测结果,随机噪声的大小可以通过差分隐私中的隐私参数来控制,采用拉普拉斯机制为每个预测结果添加随机噪声;
即:
其中,表示添加随机噪声后的预测结果,Lap表示拉普拉斯分布,Δf代表灵敏度,表示函数f对数据集D变化的敏感程度,ε表示隐私参数。这个公式可以为每个预测结果添加一定量的噪声,从而保护其隐私;
步骤七,联邦服务器收到来自不同参与方的带有随机噪声的预测结果后,通过加权平均对这些参数进行聚合,聚合后的预测结果会被加密,生成最终的预测结果,并将结果返回给各个参与方;
步骤八,对训练好的全局模型进行测试和验证,以验证其预测性能,具体来说,将数据集划分为几个部分,每次将其中一个部分作为测试集,其余部分作为训练集,然后在训练集上进行模型训练,在测试集上进行模型测试,计算模型的性能指标,重复进行多次,最终得到平均性能指标;这个过程可以重复进行多轮,直到全局模型达到预期的精度,实现体医数据融合的科学健身健康指导。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安体育学院,未经西安体育学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310565639.3/1.html,转载请声明来源钻瓜专利网。