[发明专利]联邦学习中参与方价值贡献计算方法、装置、设备及介质在审
申请号: | 202211101276.X | 申请日: | 2022-09-09 |
公开(公告)号: | CN116384502A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 王济平;黎刚;汤克云;徐炽明;杨劲业 | 申请(专利权)人: | 京信数据科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 深圳余梅专利代理事务所(特殊普通合伙) 44519 | 代理人: | 陈余才 |
地址: | 528400 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联邦 学习 参与 价值 贡献 计算方法 装置 设备 介质 | ||
1.联邦学习中参与方价值贡献计算方法,其特征在于,所述联邦学习包括多个参与方以及对多个参与方具有协调作用的平台运营方,其中多个参与方中有一个参与方为联邦学习任务的发起者,其余的参与方负责协助完成联邦学习任务;所述方法包括:
各参与方上传数据并创建联邦学习模型;
各参与方设置数据总价值并通过发起者运行创建的联邦学习模型;
统计平台运营方的算力损耗价值;
计算各参与方上传数据中的有效数据量价值;
计算各参与方上传数据中数据特征价值;
计算各参与方上传数据中垂直业务数据价值;
计算各参与方上传数据中数据特征分级价值;
将有效数据量价值、数据特征价值、垂直业务数据价值和数据特征分级价值进行价值汇总处理,以得到各参与方的价值贡献权重。
2.根据权利要求1所述的联邦学习中参与方价值贡献计算方法,其特征在于,所述各参与方上传数据并创建联邦学习模型中,所述上传数据为联邦学习模型所需使用到的meta信息。
3.根据权利要求1所述的联邦学习中参与方价值贡献计算方法,其特征在于,所述统计平台运营方的算力损耗价值,包括:
为联邦学习任务分配硬件计算资源;
统计硬件计算资源的使用时长,以得到算力损耗价值。
4.根据权利要求1所述的联邦学习中参与方价值贡献计算方法,其特征在于,所述计算各参与方上传数据中的有效数据量价值,包括:
根据各参与方上传数据判断联邦学习的任务类型;
若任务类型为纵向联邦学习,则对上传数据进行第一次安全求交处理,以得到安全求交结果;
对安全求交结果进行数据意图分析处理,以得到意图识别结果;
对意图识别结果进行训练行为分析,以得到训练行为识别结果;
采用知识图谱分析各参与方的作用价值,并结合意图识别结果和训练行为识别结果,以得到各参与方的有效特征数据;
将各参与方的有效特征数据与各参与方上传数据进行对比,以得到各参与方的有效数据量价值。
5.根据权利要求1所述的联邦学习中参与方价值贡献计算方法,其特征在于,所述计算各参与方上传数据中数据特征价值,包括:
同步计算各参与方上传数据对联邦学习模型的重要行程度,以得到特征重要性结果;
同步计算各参与方上传数据的信息熵,以得到特征信息熵结果;
对各参与方上传数据采用固定值的方法进行权衡,以确定出是否包含数据标签。
6.根据权利要求1所述的联邦学习中参与方价值贡献计算方法,其特征在于,所述计算各参与方上传数据中垂直业务数据价值,包括:
采用神经网络对联邦学习模型进行意图分析,以得到意图分析结果;
基于意图分析结果搭建全连接神经网络,并通过全连接神经网络分析得到联邦学习模型所属领域;
通过知识图谱对联邦学习模型所属领域进行相关知识内容提取;
将提取的相关知识内容利用图神经网络进行分析处理,以得到各参与方的垂直业务数据价值。
7.根据权利要求1所述的联邦学习中参与方价值贡献计算方法,其特征在于,所述计算各参与方上传数据中数据特征分级价值,包括:
将各参与方上传数据中的有效数据量价值经过神经网络处理,以得到关于信息重要性的张量体现信息;
将各参与方上传数据中数据特征价值经过神经网络处理,以得到关于特征价值的张量体现信息;
各参与方分别上传数据的分布信息,以得到分布信息结果;
将张量体现信息、张量体现信息和分布信息汇总后利用神经网络进行分级分析,以得到分级分析结果;
通过分级分析结果计算各参与方的数据分级贡献值,以得到数据特征分级价值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京信数据科技有限公司,未经京信数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211101276.X/1.html,转载请声明来源钻瓜专利网。