[发明专利]实现隐私保护的数据处理方法和装置在审
申请号: | 202010201068.1 | 申请日: | 2020-03-20 |
公开(公告)号: | CN111414646A | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 陈元丰;谢翔;晏意林;黄高峰;史俊杰;李升林;孙立林 | 申请(专利权)人: | 矩阵元技术(深圳)有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60;G06N20/00 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 周达;刘飞 |
地址: | 518061 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 隐私 保护 数据处理 方法 装置 | ||
本说明书提供了一种实现隐私保护的数据处理方法和装置,其中,该方法由多个数据持有方执行,多个数据持有方中各数据持有方中存储有各自的隐私样本数据,该方法包括:将预设明文机器学习模型中的明文算子替换为明文算子对应的密码算子,得到预设明文机器学习模型对应的隐私机器学习模型;执行安全多方计算,以基于各数据持有方中存储的各自的隐私样本数据对隐私机器学习模型进行联合训练,输出目标机器学习模型。上述方案仅需将明文机器学习模型中的明文算子替换为对应的密码学算子,即可保护隐私样本数据不被泄露,操作方便简单,易用性强。
技术领域
本申请涉及数据安全技术领域,特别涉及一种实现隐私保护的数据处理方法和装置。
背景技术
随着人工神经网络反向传播算法的提出,掀起了机器学习的热潮。机器学习需要大量的样本数据,人们开始担心自己的隐私数据被收集后会被泄露或者是被不正当使用。因此,如何将隐私数据很好地保护起来对未来机器学习至关重要。
目前,结合密码学与AI(Artificial Intelligence,人工智能)能够解决现在数据行业隐私保护的问题。因此,各种基于加密机器学习的框架(例如,TF-Encrypted、PySyft等)应运而生。这些加密机器学习框架与主流AI框架(例如,Tensorflow、PyTorch等)类似,利用了框架API(Application Programming Interface,应用程序接口)的易用性,同时通过MPC(Secure Multi-Party Computation,安全多方计算)和HE(HomomorphicEncryption,同态加密)等多种密码学算法对加密数据进行训练和预测。然而,这些加密机器学习框架在易用性、可扩展性和性能等方面均存在缺陷,特别是易用性将会影响这些加密机器学习框架的推广。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本说明书实施例提供了一种实现隐私保护的数据处理方法和装置,以解决现有技术中的隐私机密机器学习框架的易用性差的问题。
本说明书实施例提供了一种实现隐私保护的数据处理方法,由多个数据持有方执行,多个数据持有方中各数据持有方中存储有各自的隐私样本数据,该方法包括:将预设明文机器学习模型中的明文算子替换为明文算子对应的密码算子,得到预设明文机器学习模型对应的隐私机器学习模型;执行安全多方计算,以基于各数据持有方中存储的各自的隐私样本数据对隐私机器学习模型进行联合训练,输出目标机器学习模型。
在一个实施例中,将预设明文机器学习模型中的明文算子替换为明文算子对应的密码算子,包括:获取多个密码算子,并对多个密码算子中各密码算子进行注册;获取优化器程序,并对优化器程序进行注册,其中,优化器程序用于将预设明文机器学习模型中的明文算子替换为对应的密码算子。
在一个实施例中,优化器程序还用于将预设明文机器学习模型中的明文算子梯度函数替换为对应的密码算子梯度函数;相应地,在获取多个密码算子,并对多个密码算子中各密码算子进行注册之后,还包括:获取多个密码算子中各密码算子对应的密码算子梯度函数,并对各密码算子对应的密码算子梯度函数进行注册;将经注册的密码算子梯度函数与对应的经注册的密码算子进行关联。
在一个实施例中,将预设明文机器学习模型中的明文算子替换为明文算子对应的密码算子,包括:获取安装包文件,其中,安装包文件是基于二进制文件构建的,二进制文件由用于实现多个密码算子的源码、用于实现优化器程序的源码、用于注册多个密码算子的源码和用于注册优化器程序的源码编译后得到,优化器程序在执行时用于将明文模型中的明文算子替换为明文算子对应的密码算子;对安装包文件进行安装;将安装后的文件导入预设明文机器学习模型,以将预设明文机器学习模型中的明文算子替换为对应的密码算子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于矩阵元技术(深圳)有限公司,未经矩阵元技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010201068.1/2.html,转载请声明来源钻瓜专利网。