[发明专利]基于ADMM的不平衡大数据分布式分类方法在审

专利信息
申请号: 202110781204.3 申请日: 2021-07-10
公开(公告)号: CN113627485A 公开(公告)日: 2021-11-09
发明(设计)人: 王慧慧;吴昌胜;赵林;赵庆玲 申请(专利权)人: 南京理工大学
主分类号: G06K9/62 分类号: G06K9/62;G06F17/10
代理公司: 南京理工大学专利中心 32203 代理人: 陈鹏
地址: 210094 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 admm 不平衡 数据 分布式 分类 方法
【权利要求书】:

1.一种基于ADMM的不平衡大数据分布式分类方法,其特征在于,包括如下步骤:

步骤1、将不平衡的大数据集划分成n份可独立计算的小数据集,并将n份小数据集分别放入n台从机中用于每台机器的本地训练;

步骤2、从训练样本中随机选取样本,采用对偶坐标下降法对每个问题的对偶问题进行优化,计算出局部模型的局部变量wi;所述小数据集对应一个小问题;

步骤3、将所有从机计算出的局部变量wi发送给主机;

步骤4、主机利用从机发送来的局部变量wi更新全局变量z;

步骤5、主机收到每个从机发来的wi和ui并计算出z后,将z广播给每个从机以进行下一轮计算直至满足终止条件。

2.根据权利要求1所述的基于ADMM的不平衡大数据分布式分类方法,其特征在于,步骤3等待步骤2中所有从机的局部变量wi计算出来后,将所有的局部变量发送给主机。

3.根据权利要求1所述的基于ADMM的不平衡大数据分布式分类方法,其特征在于,步骤5中主机将全局变量广播给所有从机后重复步骤2至步骤4直至满足终止条件。

4.根据权利要求1所述的基于ADMM的不平衡大数据分布式分类方法,其特征在于,步骤1将问题划分为多个可并行计算的子问题后,用如下的函数表示:

s.t.wi=z,i=1,2,…,n;

其中,z为全局变量,wi为局部变量,C>0,是一个超参数;C-和C+分别是多数类和少数类的误分类参数;假设数据来自n台机器,那么可以表示为(D1,D2,…,Dn);另外ξj=max{0,1-yjwTxj}表示样本j的损失,其中yj为1或-1,wT表示权重向量,xj表示样本j,

为简单起见,(1)式可改写为:

s.t.wi=z,i=1,2,…,n

其中,fi(wi)是数据集Di的总共损失。

5.根据权利要求1所述的基于ADMM的不平衡大数据分布式分类方法,其特征在于,将原函数(2)改写成增广拉格朗日形式即原问题的对偶问题:

其中,λi≥0为对偶变量;之后得到(3)式的标准形式:

这里ui=λi/ρ,ρ为惩罚系数;

使用soft-margin CSSVM,则原始问题的对偶形式为:

s.t.0≤αj≤Cj,j=1,…,s,

其中,Cj为样本j损失的惩罚系数,bi=[1-y1viTx1,...,1-ysviTxsT;

使用随机对偶坐标下降法优化每个单机的上述问题,可计算得到:

在随机对偶坐标下降法,至的更新是通过固定其它变量来得到的;因此,(6)式问题在每次内迭代中可表达成单变量问题;通过将投射进区间[0,Cj],得到投影偏导于是的更新可表达为:

之后,可更新为:

已经得证局部变量的松弛形式可以加速算法收敛,所以可将局部变量的更新再变为:

6.根据权利要求1所述的基于ADMM的不平衡大数据分布式分类方法,其特征在于,步骤4、主机综合各从机的局部模型变量计算全局模型变量z并下发各从机,zk+1的更新公式如下:

由于函数是关于z的二次函数,同时也是一个凸函数,所以z有一个封闭解:

之后,需要更新对偶变量公式如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110781204.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top