[发明专利]大规模数据的密文机器学习模型训练方法有效
申请号: | 202110787099.4 | 申请日: | 2021-07-13 |
公开(公告)号: | CN113591942B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 赵伟;卢健;张文政;王林;汤殿华;陈智罡;张晶 | 申请(专利权)人: | 中国电子科技集团公司第三十研究所 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/27;G06F17/16;G06F21/60;G06N20/00;G06N3/048 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 徐静 |
地址: | 610000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大规模 数据 机器 学习 模型 训练 方法 | ||
1.一种大规模数据的密文机器学习模型训练方法,其特征在于,包括:
在基于全同态加密的训练中使用大规模数据,对大规模数据集进行分块加密,并对分块的密文进行bootstrapping使密文噪音下降;所述分块加密的方法包括小批量梯度下降法,根据打包密文中的槽数来设置小批量处理块的大小,从而最大限度地利用打包密文的容量;并采用NAG即内斯特罗夫加速梯度作为梯度下降优化方法进行优化;
在进行逻辑回归时,使用最小二乘拟合方法来近似激活函数,从而把非线性的计算转为线性的计算;
具有适合于全同态加密的逻辑回归基线方法,包括以下步骤:
S101. 初始化权重向量:初始化权重向量和为零向量;
S102. 使用小批量梯度下降法进行分块:按顺序或随机选择一个小批量训练集{
S103. 使用最小二乘拟合方法来近似sigmoid函数:令,,其中为sigmoid函数的多项式近似,
S104. 使用NAG方法作为梯度下降优化方法进行优化:
其中,和为参数,并令,;
S105. 循环迭代并输出最终的权重向量:重复步骤S102~S104,迭代
训练集的分割和加密方法包括以下步骤:
S201. 假设训练集由个样本和个特征数组成,将这些数据视为一个包括目标的矩阵包括目标,如下所示:
其中,并且,,;
S202. 将矩阵分成多个子矩阵,如下所示:
其中,,;
S203. 将子矩阵应该被打包成一个单个密文:利用最大的密文槽来设置和,即,并将设置为与bootstrapping并行化的权重向量的分割大小相同;
S204. 去加密成一个单独的密文:先将表示成一个向量:
再将向量加密为:
。
2.根据权利要求1所述的一种大规模数据的密文机器学习模型训练方法,其特征在于,对权重向量进行划分和加密,包括以下步骤:
S301. 将权重向量和分成多个子向量和,以实现bootstrapping并行化;
S302. 构造矩阵和,每个矩阵由个重复的子向量和组成,如下所示:
S303. 用和分别来表示矩阵和的加密,并初始化为零向量的加密。
3.根据权利要求2所述的一种大规模数据的密文机器学习模型训练方法,其特征在于,通过向量的迭代循环方法,对逻辑回归基线方法进行优化,所述向量的迭代循环方法包括以下步骤:
S401. 输入矩阵和,其中;
S402. 计算和的哈达玛积:;
S403. 计算的列向量的和:;
S404. 使用sigmoid函数的最小二乘拟合多项式逼近:令,计算,其中表示分别由0.5、0.15和0.0015重复组成的矩阵,表示按位取幂;
S405. 计算和的哈达玛积:;
S406. 计算的行向量的和:;
S407. 使用NAG方法进行优化:,,其中和为参数;
S408. 输出矩阵和,其中。
4.根据权利要求3所述的一种大规模数据的密文机器学习模型训练方法,其特征在于,计算行向量的和方法包括以下步骤:
S501. 对于,令为将的每个元素向左旋转位得到的矩阵;
S502. 初始化,递归次计算,即的行向量之和为:
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第三十研究所,未经中国电子科技集团公司第三十研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110787099.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置