[发明专利]一种数据处理系统和方法在审

专利信息
申请号: 201910447210.8 申请日: 2019-05-27
公开(公告)号: CN112001475A 公开(公告)日: 2020-11-27
发明(设计)人: 李琦;李晗 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06N3/02 分类号: G06N3/02
代理公司: 北京思格颂知识产权代理有限公司 11635 代理人: 杨超
地址: 英属开曼群岛大开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据处理系统 方法
【说明书】:

发明公开了一种数据处理系统和方法,该系统包括:数据拆分节点、中间节点和合并节点;数据拆分节点,用于将数据拆分为两个以上的数据分片,将一个数据分片提交给设置第一模型的中间节点,将其他数据分片提交给设置第二模型的中间节点,其中,所述第二模型与所述第一模型是模型结构相同但常数偏置项不同的神经网络模型;中间节点,用于运行其上设置的模型对数据分片进行处理,得到分片处理数据;合并节点,用于对中间节点输出的分片处理数据进行重构合并,得到数据处理结果。实现了用户数据和模型的按次可使用不可沉淀,使用户数据基于授权来使用成为可能。

技术领域

本发明涉及数据处理技术领域,特别涉及一种数据处理系统和方法。

背景技术

目前,通过机器模型对海量数据进行学习训练的技术被普遍应用。在机器学习场景下,存在数据持有方和模型持有方为多方的情况,而为了推进深度学习在工业界的应用,数据持有方和模型持有方之间存在数据分享的需求,为了保证数据分享时数据的安全性和隐私性,现有技术提供了如下解决方案:

第一种方案:将模型拆解成特征提取和神经网络模型两部分,在模型训练的前向传播过程中,数据持有方将数据经过自己本地的特征提取网络获得一个输出向量,将输出向量发送给模型持有方的神经网络模型。在模型训练的反向传播过程中,模型持有方将梯度传递给数据持有者,并要求数据持有方帮助更新前一部分的网络参数。

这种方式,从迁移学习的角度看,数据持有方经过本地模型传出来的数据虽无法完全复原,但无法限制模型持有方沉淀后用作其他用途。而且,前一部分模型的网络结构会被数据持有方获取,这是模型持有方无法接受的。

第二种方案:对数据进行加密,数据持有方将训练样本基于同态加密技术加密后,发送给模型持有方训练模型,训练好的模型,在运行数据使用同样的方式加密,传入网络获得预测结果。同态加密区别于一般简单做映射的加密方式,保留了连续值特征的线性关系。这种方式,一方面,在加密数据上进行训练,计算开销较大。另一方面,同态加密要求预测时数据使用的加密方式与模型训练时数据使用的加密方式一致,为了保证训练样本的数据安全,加密方式不能被公布。

综上,现有的两种方案通常只适用数据持有方和模型持有方相同的场景,通用性不强无法作为一般性的解决方案。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据处理系统和方法。

本发明实施例提供一种数据处理系统,包括:数据拆分节点、中间节点和合并节点;

数据拆分节点,用于将数据拆分为两个以上的数据分片,将一个数据分片提交给设置第一模型的中间节点,将其他数据分片提交给设置第二模型的中间节点,其中,所述第二模型与所述第一模型是模型结构相同但常数偏置项不同的神经网络模型;

中间节点,用于运行其上设置的模型对数据分片进行处理,得到分片处理数据;

合并节点,用于对中间节点输出的分片处理数据进行重构合并,得到数据处理结果。

在一些可选的实施例中,所述数据拆分节点用于将数据拆分为两个以上的数据分片,包括:

对数据的原始向量进行拆分,拆分成多个与原始向量维数相同的分片向量;其中,所有分片向量中相同位置的元素值之和等于原始向量中相应位置的元素值。

在一些可选的实施例中,中间节点用于运行其上设置的模型对数据分片进行处理,得到分片处理数据,包括:

每个中间节点接收数据拆分节点发送的数据分片,使用设置的第一模型或第二模型对数据分片进行多项式展开计算,基于预先生成的随机数对,对多项式变量yi进行加密,基于加密后的多项式变量yi得到数据分片对应的分片处理数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910447210.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top