[发明专利]基于ADMM的不平衡大数据分布式分类方法在审
申请号: | 202110781204.3 | 申请日: | 2021-07-10 |
公开(公告)号: | CN113627485A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 王慧慧;吴昌胜;赵林;赵庆玲 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/10 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 陈鹏 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 admm 不平衡 数据 分布式 分类 方法 | ||
1.一种基于ADMM的不平衡大数据分布式分类方法,其特征在于,包括如下步骤:
步骤1、将不平衡的大数据集划分成n份可独立计算的小数据集,并将n份小数据集分别放入n台从机中用于每台机器的本地训练;
步骤2、从训练样本中随机选取样本,采用对偶坐标下降法对每个问题的对偶问题进行优化,计算出局部模型的局部变量wi;所述小数据集对应一个小问题;
步骤3、将所有从机计算出的局部变量wi发送给主机;
步骤4、主机利用从机发送来的局部变量wi更新全局变量z;
步骤5、主机收到每个从机发来的wi和ui并计算出z后,将z广播给每个从机以进行下一轮计算直至满足终止条件。
2.根据权利要求1所述的基于ADMM的不平衡大数据分布式分类方法,其特征在于,步骤3等待步骤2中所有从机的局部变量wi计算出来后,将所有的局部变量发送给主机。
3.根据权利要求1所述的基于ADMM的不平衡大数据分布式分类方法,其特征在于,步骤5中主机将全局变量广播给所有从机后重复步骤2至步骤4直至满足终止条件。
4.根据权利要求1所述的基于ADMM的不平衡大数据分布式分类方法,其特征在于,步骤1将问题划分为多个可并行计算的子问题后,用如下的函数表示:
s.t.wi=z,i=1,2,…,n;
其中,z为全局变量,wi为局部变量,C>0,是一个超参数;C-和C+分别是多数类和少数类的误分类参数;假设数据来自n台机器,那么可以表示为(D1,D2,…,Dn);另外ξj=max{0,1-yjwTxj}表示样本j的损失,其中yj为1或-1,wT表示权重向量,xj表示样本j,
为简单起见,(1)式可改写为:
s.t.wi=z,i=1,2,…,n
其中,fi(wi)是数据集Di的总共损失。
5.根据权利要求1所述的基于ADMM的不平衡大数据分布式分类方法,其特征在于,将原函数(2)改写成增广拉格朗日形式即原问题的对偶问题:
其中,λi≥0为对偶变量;之后得到(3)式的标准形式:
这里ui=λi/ρ,ρ为惩罚系数;
使用soft-margin CSSVM,则原始问题的对偶形式为:
s.t.0≤αj≤Cj,j=1,…,s,
其中,Cj为样本j损失的惩罚系数,bi=[1-y1viTx1,...,1-ysviTxsT;
使用随机对偶坐标下降法优化每个单机的上述问题,可计算得到:
在随机对偶坐标下降法,至的更新是通过固定其它变量来得到的;因此,(6)式问题在每次内迭代中可表达成单变量问题;通过将投射进区间[0,Cj],得到投影偏导于是的更新可表达为:
之后,可更新为:
已经得证局部变量的松弛形式可以加速算法收敛,所以可将局部变量的更新再变为:
6.根据权利要求1所述的基于ADMM的不平衡大数据分布式分类方法,其特征在于,步骤4、主机综合各从机的局部模型变量计算全局模型变量z并下发各从机,zk+1的更新公式如下:
由于函数是关于z的二次函数,同时也是一个凸函数,所以z有一个封闭解:
之后,需要更新对偶变量公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110781204.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种环保气体柜
- 下一篇:一种用水区域止水梁浇筑方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置