[发明专利]一种基于联邦学习的分类方法在审
申请号: | 202110721730.0 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113344120A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 张海;卢耀宗;苏温庆 | 申请(专利权)人: | 陕西数盾慧安数据科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G06F21/62 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 耿路 |
地址: | 710199 陕西省西安市国家民用航天产*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 联邦 学习 分类 方法 | ||
1.一种基于联邦学习的分类方法,其特征在于,按照如下步骤进行:
S1.获取多个参与方提供的原始数据,并将该各参与方提供的原始数据上传到本地服务器中;多个参与方包括一个提供属性数据矩阵和标签数据向量的参与方和多个只提供属性数据矩阵的参与方;
S2.对各参与方提供的属性数据矩阵进行数据标准化处理,得到标准化的属性数据矩阵;
S3.对只提供属性数据矩阵的参与方在本地计算中间变量;
S4.对提供标签数据向量的参与方结合标签数据向量和步骤S3中计算的中间变量计算梯度中间量;
S5.根据步骤S4得到的梯度中间量在本地计算出各参与方的属性数据矩阵对应的梯度向量;
S6.各参与方根据计算的梯度向量更新各自子分类超平面,并根据更新的子分类超平面汇总为分类超平面;
S7.重复步骤S3-S6,直至达到容忍误差精度或最大迭代次数,输出最终的分类器。
2.根据权利要求1所述的一种基于联邦学习的分类方法,其特征在于,步骤S1中所述的参与方是3个,分别为A参与方、B参与方和C参与方,所述参与方A提供属性数据矩阵DA和标签数据向量YA,参与方B提供属性数据矩阵DB,参与方C提供属性数据矩阵DC。
3.根据权利要求2所述的一种基于联邦学习的分类方法,其特征在于,步骤S1中所述属性数据矩阵DA、DB和DC的维度分别为pA、pB和pC,DA、DB、DC和YA具有相同的样本量n,且YA中元素的值属于{0,1};
步骤S2中,对属性数据矩阵DA按照如下方法进行标准化处理,对于n×pA的属性数据矩阵DA计算其列均值mA和列方差sA,令XA=(DA-mA)/sA为标准化的属性数据矩阵;
按照属性数据矩阵DA的标准化处理方法对属性数据矩阵DB和DC进行标准化处理得到标准化的属性数据矩阵XB和XC;
步骤3中所述只提供属性数据矩阵的参与方在本地计算中间变量的方法是,迭代算法在第t步迭代时的分类超平面为βt,首次执行是给定初始分类超平面为β1;其中和分别为当前第t步XA、XB和XC中所包含属性对应的子分类超平面;
参与方B和参与方C分别在本地计算与并将与传输给参与方A,参与方A得到中间变量。
4.根据权利要求3所述的一种基于联邦学习的分类方法,其特征在于,步骤S4中所述参与方A基于标签数据向量和中间变量信息得到参与方A在本地计算的梯度中间量为:
并将该梯度中间量传输给参与方B和C;
步骤5中在本地计算出各参与方的属性数据矩阵对应的梯度向量的方法是,根据所得梯度中间量计算参与方A、参与方B和参与方C的属性数据矩阵中属性对应的梯度向量,梯度向量为
其中λ2≥0为l2型罚项对应的惩罚参数。
5.根据权利要求4所述的一种基于联邦学习的分类方法,其特征在于,步骤6中所述更新超分类平面的方法如下:
对参与方A的子分类超平面更新:
首先令
ηt为给定的学习率;
其次根据预先设定的l1型罚项对应的惩罚参数λ1≥0,对进行截断,对于中的第i个元素这里i∈{1,2,…,pA},截断方式为:
如果则
如果则
对中的pA个元素分别执行如上截断过程可得到更新后的子分类超平面
按照参与方A的子分类超平面更新方式,对参与方B和参与方C的子分类超平面进行更新,更新后的子分类超平面为和再进行汇总获得更新后的分类超平面
重复步骤S3-S6,直至达到容忍误差精度或最大迭代次数,输出最终的分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西数盾慧安数据科技有限公司,未经陕西数盾慧安数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110721730.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种截断机抬升取片机构
- 下一篇:双斜面工件及其夹具体的加工方法