[发明专利]多方参与的训练样本选取方法、装置、电子设备及介质在审
申请号: | 202310758296.2 | 申请日: | 2023-06-25 |
公开(公告)号: | CN116644319A | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 朱敏杰;楼骁涵 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/10;G06N3/08 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多方 参与 训练 样本 选取 方法 装置 电子设备 介质 | ||
1.一种多方参与的训练样本选取方法,包括:
联邦学习的非赋能参与方基于差分隐私算法,生成本地目标标注结果的样本的干扰特征数据,并将干扰特征数据发送至所述联邦学习的赋能参与方;
所述赋能参与方基于所述差分隐私算法,将接收到的非赋能参与方提供的干扰特征数据整合为干扰特征数据集,所述干扰特征数据集的干扰特征数据求和结果与对应除噪后的特征数据求和结果一致;
所述赋能参与方与基于节点分裂的方式构建所述干扰特征数据集的决策树,其中,任意目标节点分裂的过程包括:确定目标节点对应的每个备选分裂条件对所述目标节点进行模拟分裂,每个备选分裂条件均包含有至少一个目标标注结果下的特征数据筛选规则;确定每个模拟分裂结果相对预设数据约束条件的约束适应度,以及每个模拟分裂结果相对所述干扰特征数据集的分裂纯度变化度;基于每个备选分裂条件对应模拟分裂结果的分裂纯度变化度和约束适应度,确定每个备选分裂条件对应的综合分数;基于综合分数最优的目标备选分裂条件对所述目标节点进行实际分裂;
所述赋能参与方基于所述决策树中至少一个节点对应的目标备选分裂条件,确定所述目标标注结果的样本选取规则,并将所述样本选取规则反馈至所述非赋能参与方;
所述非赋能参与方基于接收到的所述样本选取规则,从本地未标注的样本中选取出待作为所述目标标注结果的训练样本。
2.根据权利要求1所述的方法,
所述赋能参与方基于所述决策树中至少一个节点对应实际分裂所采用的目标备选分裂条件,确定所述目标标注结果的样本选取规则,包括:
所述赋能参与方对所述决策树中每个节对应的目标备选分裂条件的组合结果进行样本覆盖度的优化求解;
所述赋能参与方将基于所述优化求解对应的目标备选分裂条件的组合结果,确定所述目标标注结果的样本选取规则。
3.根据权利要求2所述的方法,
所述赋能参与方对所述决策树中每个节对应的目标备选分裂条件的组合结果进行样本覆盖度的优化求解,包括:
所述赋能参与方在所述约束适应度的约束下,对所述决策树中每个节对应的目标备选分裂条件的组合结果进行最大化覆盖度的求解。
4.根据权利要求1至3任一项所述的方法,
所述预设数据约束条件包括:
每个模拟分裂结果的子节点的干扰特征数据在预设模型对应的预测结果与所述目标标注结果的差值小于预设阈值的最低占比。
5.根据权利要求1至3任一项所述的方法,
联邦学习的非赋能参与方基于差分隐私算法,生成本地目标标注结果的样本的干扰特征数据,包括:
联邦学习的非赋能参与方对本地目标标注结果的样本的特征数据进行求和,得到求和结果;
所述非赋能参与方将本地得到的求和结果拆分成符合差分隐私算法的先验分布的多个数据分块;
所述非赋能参与方将本地拆分得到的多个数据分块发送至所述联邦学习的其他非赋能参与方,并接收其他非赋能参与方提供的求和结果和对应的多个数据分块;
所述非赋能参与方基于本地得到的求和数据和对应的多个数据块,以及其他非赋能参与方提供的求和数据和对应的多个数据块,计算得到本地目标标注结果的样本的干扰特征数据。
6.根据权利要求1至3任一项所述的方法,
每个备选分裂条件对应模拟分裂结果的分裂纯度变化度是基于目标节点的纯度函数以及基于该备选分裂条件进行模拟分裂后得到的子节点的纯度函数所确定得到的。
7.据权利要求1至3任一项所述的方法,
基于每个备选分裂条件对应模拟分裂结果的分裂纯度变化度和约束适应度,确定每个备选分裂条件对应的综合分数,包括:
针对每个备选分裂条件,对模拟分裂结果的分裂纯度变化度和约束适应度进行加权求和,得到每个备选分裂条件对应的综合分数。
8.据权利要求1至3任一项所述的方法,
所述目标标注结果的样本包括本地标注为黑名单用户的用户样本或本地标注为风险用户的用户样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310758296.2/1.html,转载请声明来源钻瓜专利网。