[发明专利]面向机器学习算法的预测与训练流程的统一方法及装置在审

专利信息
申请号: 202110421806.8 申请日: 2021-04-20
公开(公告)号: CN112989424A 公开(公告)日: 2021-06-18
发明(设计)人: 不公告发明人 申请(专利权)人: 北京瑞莱智慧科技有限公司
主分类号: G06F21/62 分类号: G06F21/62;G06K9/62;G06N20/00
代理公司: 北京开阳星知识产权代理有限公司 11710 代理人: 安伟
地址: 100084 北京市海淀区中*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 机器 学习 算法 预测 训练 流程 统一 方法 装置
【说明书】:

本公开涉及面向机器学习算法的预测与训练流程的统一方法及装置,该方法包括:获取第一机器学习算法;其中,第一机器学习算法中基础原语的作用对象是不能以索引方式访问的树结构;对基础原语进行计算流程的改造,使改造后基础原语的作用对象是以索引方式访问的树结构;基于改造后基础原语,将第一机器学习算法转换为满足数据隐私保护协议的第二机器学习算法;其中,第二机器学习算法的作用对象是以索引方式访问的树结构,且该树结构包括:内部节点、叶子节点和各节点的位置索引;第二机器学习算法用于基于树结构的预测任务。本公开能够无侵入的实现预测过程和训练过程的统一。

技术领域

本公开涉及计算机技术领域,尤其涉及面向机器学习算法的预测与训练流程的统一方法及装置。

背景技术

数据隐私保护一般指的是数据所属地(有权限一方)的特征或标签不能明文地传输给非数据所属地(无权限一方),在需要多方参与的机器学习场景中,既需要多方数据参与信息交互完成模型训练,又需要保证数据安全、保护数据隐私。当前机器学习场景中的数据隐私保护主要技术是联邦学习。一种常见的数据隐私保护的场景是,特征数据和标签数据分别在两个不同参与方(又称纵向联邦学习),双方需要在不直接或间接泄露特征数据/标签数据的要求下完成机器学习训练算法(如XGBoost算法)训练。

然而,为了实现数据隐私保护,目前在机器学习训练算法的纵向联邦学习过程中,很难实现算法训练过程和预测过程的统一。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种面向机器学习算法的预测与训练流程的统一方法及装置。

本公开提供了一种面向机器学习算法的预测与训练流程的统一方法,包括:

获取第一机器学习算法;其中,所述第一机器学习算法中基础原语的作用对象是不能以索引方式访问的树结构;

对所述基础原语进行计算流程的改造,使改造后基础原语的作用对象是以索引方式访问的树结构;

基于改造后基础原语,将所述第一机器学习算法转换为满足数据隐私保护协议的第二机器学习算法;其中,所述第二机器学习算法的作用对象是以索引方式访问的树结构,且该树结构包括:内部节点、叶子节点和各节点的位置索引;所述第二机器学习算法用于基于树结构的预测任务。

可选的,所述改造后基础原语包括:第一对象、第二对象、第一参数和第二参数;其中:

所述第一对象用于表示第一参与方的树结构,且所述第一参与方的树结构的内部节点中包括特征阈值数据;

所述第二对象用于表示第二参与方的树结构,且所述第二参与方的树结构的叶子节点中包括预测数据;

所述第一参数用于在第一参与方根据内部节点将特征数据转换为位置索引;

所述第二参数用于在第二参与方的树结构中选择与所述位置索引对应的叶子节点,且选择的叶子节点中包含的预测数据用于执行用户指定的apply函数计算操作。

可选的,所述对所述基础原语进行计算流程的改造,包括:

根据内部节点中的特征阈值数据,将所述基础原语中需要多方交互的第一参与方的特征数据,转换为位置索引;以及,将所述位置索引应用到第二参与方,以使第二参与方根据所述位置索引选择第二参与方的预测数据执行用户指定的计算操作。

可选的,所述方法包括:

通过对所述基础原语进行分析,确定所述基础原语中的第一对象和第二对象均是以索引方式访问的树结构,以及确定所述第一对象的索引定义域与所述第二对象的索引值域是同一区间;

将确定的所述第一对象和第二对象以索引方式访问,以及所述第一对象的索引定义域与所述第二对象的索引值域是同一区间,作为对所述基础原语进行改造的使用条件。

可选的,在不同的参与方中,所述第二机器学习算法的树结构均以索引方式访问,且不同参与方的所述第二机器学习算法的树结构是同一树结构形式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京瑞莱智慧科技有限公司,未经北京瑞莱智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110421806.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top