[发明专利]基于跨特征联邦的XGBoost模型的数据处理方法在审
申请号: | 202210336835.9 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114648073A | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 潘富城;傅致晖;孟丹;李晓林 | 申请(专利权)人: | 杭州博盾习言科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉 |
地址: | 311121 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 联邦 xgboost 模型 数据处理 方法 | ||
1.一种基于跨特征联邦的XGBoost模型的数据处理方法,其特征在于,包括:
通过分布式计算节点确定标签方数据对应的梯度参数,并根据所述梯度参数确定用于多维度表征所述标签方数据的第一直方图信息;
加密所述梯度参数得到梯度密文,并基于流水线并行处理方式向无标签方发送对应于所述标签方数据的梯度密文;其中,所述无标签方根据所述梯度密文和本方数据确定用于多维度表征无标签方数据的第二直方图信息,并将所述第二直方图信息发送至标签方;
根据所述第一直方图信息和所述第二直方图信息确定节点分裂信息,并根据所述节点分裂信息对基于所述标签方数据构建的第一特征节点树进行节点分裂处理;
将所述节点分裂信息同步至所述无标签方;其中,所述无标签方根据所述节点分裂信息对基于所述本方数据构建的第二特征节点树进行节点分裂处理。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据预设比例从所述标签方数据中选取第一数据集;
根据所述第一数据集构建所述第一特征节点树;
根据所述第一特征节点树中各特征节点对应的增益值从所述各特征节点中选取第一目标特征节点;
根据所述各特征节点对应的各特征节点对应的梯度参数从所述各特征节点中选取第二目标特征节点;
根据所述第一目标特征节点、所述第二目标特征节点和其余特征节点确定用于构建新特征节点树的特征数据;其中,所述其余特征节点为所述各特征节点中除所述第一目标特征节点和所述第二目标特征节点之外的特征节点。
3.根据权利要求1所述的方法,其特征在于,根据所述梯度参数确定用于多维度表征标签方数据的第一直方图信息,包括:
根据所述梯度参数确定所述第一特征节点树中父节点对应的直方图子信息和左分支节点对应的直方图子信息,并根据所述父节点对应的直方图子信息和左分支节点对应的直方图子信息确定右分支节点对应的直方图子信息,直到确定出所述第一直方图信息;或者,
根据所述梯度参数确定所述第一特征节点树中父节点对应的直方图子信息和右分支节点对应的直方图子信息,并根据所述父节点对应的直方图子信息和右分支节点对应的直方图子信息确定左分支节点对应的直方图子信息,直到确定出所述第一直方图信息。
4.根据权利要求1所述的方法,其特征在于,所述无标签方用于根据所述梯度密文和本方数据确定用于多维度表征所述本方数据的第二直方图信息,包括:
所述无标签方用于在接收到所述梯度密文时,根据所述梯度密文和所述本方数据确定所述第二特征节点树中父节点对应的直方图子信息和左分支节点对应的直方图子信息,并根据所述父节点对应的直方图子信息和所述左分支节点对应的直方图子信息确定右分支节点对应的直方图子信息,直到确定出所述第二直方图信息;或者,
所述无标签方用于在接收到所述梯度密文时,根据所述梯度密文和所述本方数据确定所述第二特征节点树中父节点对应的直方图子信息和右分支节点对应的直方图子信息,并根据所述父节点对应的直方图子信息和所述右分支节点对应的直方图子信息确定左分支节点对应的直方图子信息,直到确定出所述第二直方图信息。
5.根据权利要求1所述的方法,其特征在于,通过分布式计算节点确定所述标签方数据对应的梯度参数,包括:
控制所述分布式计算节点基于各自对应的指针数据从共享存储空间中获取相对应的数据切片,并计算所述数据切片对应的梯度参数;其中,所述标签方数据由多个数据切片构成;
根据所述数据切片对应的梯度参数确定所述标签方数据对应的梯度参数。
6.根据权利要求1~5任一项所述的方法,其特征在于,所述节点分裂信息至少包括分裂特征数据及所述分裂特征数据对应的分裂位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州博盾习言科技有限公司,未经杭州博盾习言科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210336835.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种注液装置及注液生产线
- 下一篇:一种DOC硫中毒判断方法及车辆