[发明专利]大规模数据的密文机器学习模型训练方法有效

专利信息
申请号: 202110787099.4 申请日: 2021-07-13
公开(公告)号: CN113591942B 公开(公告)日: 2023-05-09
发明(设计)人: 赵伟;卢健;张文政;王林;汤殿华;陈智罡;张晶 申请(专利权)人: 中国电子科技集团公司第三十研究所
主分类号: G06F18/214 分类号: G06F18/214;G06F18/27;G06F17/16;G06F21/60;G06N20/00;G06N3/048
代理公司: 成都九鼎天元知识产权代理有限公司 51214 代理人: 徐静
地址: 610000 *** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 大规模 数据 机器 学习 模型 训练 方法
【权利要求书】:

1.一种大规模数据的密文机器学习模型训练方法,其特征在于,包括:

在基于全同态加密的训练中使用大规模数据,对大规模数据集进行分块加密,并对分块的密文进行bootstrapping使密文噪音下降;所述分块加密的方法包括小批量梯度下降法,根据打包密文中的槽数来设置小批量处理块的大小,从而最大限度地利用打包密文的容量;并采用NAG即内斯特罗夫加速梯度作为梯度下降优化方法进行优化;

在进行逻辑回归时,使用最小二乘拟合方法来近似激活函数,从而把非线性的计算转为线性的计算;

具有适合于全同态加密的逻辑回归基线方法,包括以下步骤:

S101. 初始化权重向量:初始化权重向量和为零向量;

S102. 使用小批量梯度下降法进行分块:按顺序或随机选择一个小批量训练集{Zi},其中,为小批量处理块的大小,f为特征数;训练集{Zi}的样本被构造为,其中,和分别是原始输入样本和标签值;

S103. 使用最小二乘拟合方法来近似sigmoid函数:令,,其中为sigmoid函数的多项式近似,j[1,...,m];

S104. 使用NAG方法作为梯度下降优化方法进行优化:

其中,和为参数,并令,;

S105. 循环迭代并输出最终的权重向量:重复步骤S102~S104,迭代K次后输出权重向量和;

训练集的分割和加密方法包括以下步骤:

S201. 假设训练集由个样本和个特征数组成,将这些数据视为一个包括目标的矩阵包括目标,如下所示:

其中,并且,,;

S202. 将矩阵分成多个子矩阵,如下所示:

其中,,;

S203. 将子矩阵应该被打包成一个单个密文:利用最大的密文槽来设置和,即,并将设置为与bootstrapping并行化的权重向量的分割大小相同;

S204. 去加密成一个单独的密文:先将表示成一个向量:

再将向量加密为:

2.根据权利要求1所述的一种大规模数据的密文机器学习模型训练方法,其特征在于,对权重向量进行划分和加密,包括以下步骤:

S301. 将权重向量和分成多个子向量和,以实现bootstrapping并行化;

S302. 构造矩阵和,每个矩阵由个重复的子向量和组成,如下所示:

S303. 用和分别来表示矩阵和的加密,并初始化为零向量的加密。

3.根据权利要求2所述的一种大规模数据的密文机器学习模型训练方法,其特征在于,通过向量的迭代循环方法,对逻辑回归基线方法进行优化,所述向量的迭代循环方法包括以下步骤:

S401. 输入矩阵和,其中;

S402. 计算和的哈达玛积:;

S403. 计算的列向量的和:;

S404. 使用sigmoid函数的最小二乘拟合多项式逼近:令,计算,其中表示分别由0.5、0.15和0.0015重复组成的矩阵,表示按位取幂;

S405. 计算和的哈达玛积:;

S406. 计算的行向量的和:;

S407. 使用NAG方法进行优化:,,其中和为参数;

S408. 输出矩阵和,其中。

4.根据权利要求3所述的一种大规模数据的密文机器学习模型训练方法,其特征在于,计算行向量的和方法包括以下步骤:

S501. 对于,令为将的每个元素向左旋转位得到的矩阵;

S502. 初始化,递归次计算,即的行向量之和为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第三十研究所,未经中国电子科技集团公司第三十研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110787099.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top