[发明专利]一种基于纵向联邦的孤立森林训练和预测方法及系统有效
申请号: | 202111040857.2 | 申请日: | 2021-09-07 |
公开(公告)号: | CN113506163B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 郭浩亮;刘凯 | 申请(专利权)人: | 百融云创科技股份有限公司 |
主分类号: | G06Q40/00 | 分类号: | G06Q40/00;G06N20/00 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 刘铁生;孟阿妮 |
地址: | 100000 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 纵向 联邦 孤立 森林 训练 预测 方法 系统 | ||
1.一种基于纵向联邦的孤立森林训练和预测方法,其中,所述方法包括:
获得第一交集数据,其中,所述第一交集数据为第一数据集合和第二数据集合的样本id交集数据中第一客户端的数据;
获得第二交集数据,其中,所述第二交集数据为所述第一数据集合和所述第二数据集合的样本id交集数据中的第二客户端的数据;
对所述第一交集数据和所述第二交集数据分别进行匿名化处理,获得第一匿名化交集数据和第二匿名化交集数据;
获得第一算法参数设定指令,根据所述第一算法参数设定指令设定孤立树最大分裂深度d和所述孤立树的数量n,获得第一参数设定结果;
根据所述第一参数设定结果、孤立森林生成方法、所述第一匿名化交集数据和所述第二匿名化交集数据,在第一客户端生成第一孤立森林,在第二客户端生成第二孤立森林;
基于所述第一孤立森林、所述第二孤立森林对所述第一客户端、所述第二客户端,根据孤立森林预测方法进行数据预测,且所述第一孤立森林为对所述第一客户端进行预测的孤立森林,所述第二孤立森林为对所述第二客户端进行预测的孤立森林,其中,所述第一客户端为所述第一数据集合对应的客户端,所述第二客户端为所述第二数据集合对应的客户端。
2.如权利要求1所述的方法,其中,所述方法还包括:
获得第一孤立树,其中,所述第一孤立树为(i,d),其中,i为所述第一孤立树的编号,d为所述第一孤立树的最大分裂深度;
获得第一生成指令,根据所述第一生成指令生成所述第一孤立树的根节点;
获得第一采样指令,根据所述第一采样指令对所述第一匿名化交集数据集或第二匿名化交集数据集中的任一数据集的样本id进行采样,获得第一采样结果,并将所述第一孤立树的编号、所述第一采样结果写入所述根节点;
根据节点分裂方法,生成完整的第一孤立树;
重复所述第一孤立树的生成方法,直至获得n棵孤立树。
3.如权利要求2所述的方法,其中,所述节点分裂方法还包括:
通过所述第一客户端或所述第二客户端获得第一特征抽取指令,根据所述第一特征抽取指令对所述第一数据集合和所述第二数据集合的全部特征进行特征抽取,获得第一特征抽取结果;
判断所述第一特征抽取结果的特征归属客户端,获得第一判断结果;
当所述第一判断结果为第一客户端时,由所述第一客户端执行所述第一孤立树的节点分裂,当所述第一判断结果为第二客户端时,由所述第二客户端执行所述第一孤立树的节点分裂,如果当前执行操作的客户端与执行节点分裂的客户端不同,由当前客户端向另一客户端同步孤立森林信息,其中,所述孤立森林信息仅包括样本分裂结果,不包括分裂阈值,如果当前执行操作的客户端与执行节点分裂的客户端相同,则不需要即时同步孤立森林信息;
根据所述第一特征抽取结果,随机在特征最大最小值之间取分裂阈值,根据所述分裂阈值进行分裂,获得第一节点分裂结果,根据所述第一节点分裂结果对执行所述节点分裂的客户端进行孤立森林更新,根据所述第一节点分裂结果获得当前节点的两个子节点,并基于所述特征分裂方法进行所述两个子节点的继续分裂。
4.如权利要求3所述的方法,其中,所述获得第一特征抽取指令之前,还包括:
获得所述第一孤立树的待分裂节点信息;
根据所述待分裂节点信息获得所述第一孤立树的节点内样本数和节点深度;
当所述节点内样本数小于等于1或节点深度等于d时,则不对当前节点进行节点分裂。
5.如权利要求1所述的方法,其中,所述方法还包括:
获得一致性调整指令,根据所述一致性调整指令在所述第一孤立森林和所述第二孤立森林训练结束前进行一致性调整,其中,所述一致性调整不对分裂阈值进行一致性调整,只对样本分裂结果进行调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百融云创科技股份有限公司,未经百融云创科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111040857.2/1.html,转载请声明来源钻瓜专利网。