[发明专利]联邦学习中参与方价值贡献计算方法、装置、设备及介质在审
申请号: | 202211101276.X | 申请日: | 2022-09-09 |
公开(公告)号: | CN116384502A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 王济平;黎刚;汤克云;徐炽明;杨劲业 | 申请(专利权)人: | 京信数据科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 深圳余梅专利代理事务所(特殊普通合伙) 44519 | 代理人: | 陈余才 |
地址: | 528400 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联邦 学习 参与 价值 贡献 计算方法 装置 设备 介质 | ||
本发明实施例公开了一种联邦学习中参与方价值贡献计算方法、装置、设备及介质,其中方法包括:各参与方上传数据并创建联邦学习模型;各参与方设置数据总价值并通过发起者运行创建的联邦学习模型;统计平台运营方的算力损耗价值;计算各参与方上传数据中的有效数据量价值;计算各参与方上传数据中数据特征价值;计算各参与方上传数据中垂直业务数据价值;计算各参与方上传数据中数据特征分级价值;将有效数据量价值、数据特征价值、垂直业务数据价值和数据特征分级价值进行价值汇总处理,以得到各参与方的价值贡献权重。本发明可有效评估出整个联邦学习中各角色的价值贡献,满足了不同业务场景下的商用价值划分。
技术领域
本发明涉及机器学习技术领域,更具体地说是联邦学习中参与方价值贡献计算方法、装置、设备及介质。
背景技术
联邦学习(Federated Learning)指的是一种多个参与方在保证各自原始私有数据不出数据方定义的私有边界的前提下,协作完成某项机器学习任务的模式。
现有的联邦学习产品中,仅完成了模型任务训练预测本身。产品本身缺乏有效的措施对各参与方提供贡献价值进行评估,而在以数据为中心衡量各参与方贡献价值的方式上,更是存在如下几个重要问题:
第一,联邦学习任务中除了各参与方外,实时上还有一个负责中心协议与协调的平台方,目前没有对平台方的价值进行计算。
第二,大部分产品仅简单计算特征重要性与信息熵,这样的场景下在横向联邦无法计算各参与方的数据价值贡献。
第三,在联邦学习中,存在着部分不良参与方利用数据实施非主动性攻击。例如:使用包含大量噪音的数据集。若不识别出噪音数据,将会对降低数据价值评估的准确性。
第四,在联邦学习模型中,存在着一类特征对模型重要程度不高,但实际业务价值重大。若不识别出这类特征,将会对降低数据价值评估的准确性。
第五,在联邦学习模型中,数据针对不同的业务场景其实有着不一样的分级体现。这种等级更多的从商业化安全的角度衡量数据特征的重要性。若不识别出这类特征,将会对降低数据价值评估的准确性。
由此存在上述问题,目前联邦学习无法有效衡量各参与方贡献价值及平台对联邦学习任务的维护贡献评估,由于缺乏一种有效的价值贡献评估方法,导致无法从商业化的角度将模型或结果以收费的形式提供给第三方机构使用。
因此,有必要设计一种可实现合理的联邦学习价值贡献计算的方法,以满足不同业务场景下的商用价值划分。
发明内容
本发明的目的在于克服现有技术的不足,提供联邦学习中参与方价值贡献计算方法、装置、设备及介质,实现了联邦学习中各参与方与平台运营方的价值贡献的计算,满足了不同业务场景下的商用价值划分。
为实现上述目的,本发明采用以下技术方案:
第一方面,联邦学习中参与方价值贡献计算方法,所述联邦学习包括多个参与方以及对多个参与方具有协调作用的平台运营方,其中多个参与方中有一个参与方为联邦学习任务的发起者,其余的参与方负责协助完成联邦学习任务;所述方法包括:
各参与方上传数据并创建联邦学习模型;
各参与方设置数据总价值并通过发起者运行创建的联邦学习模型;
统计平台运营方的算力损耗价值;
计算各参与方上传数据中的有效数据量价值;
计算各参与方上传数据中数据特征价值;
计算各参与方上传数据中垂直业务数据价值;
计算各参与方上传数据中数据特征分级价值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京信数据科技有限公司,未经京信数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211101276.X/2.html,转载请声明来源钻瓜专利网。