[发明专利]一种基于交替乘子法的分布式大数据分类系统及方法在审
申请号: | 201410498542.6 | 申请日: | 2014-09-25 |
公开(公告)号: | CN104217022A | 公开(公告)日: | 2014-12-17 |
发明(设计)人: | 廖士中;李子达 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F9/44 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于交替乘子法的分布式大数据分类系统及方法,其系统包括采样模块、随机特征映射模块和分布式线性支持向量机模块,其中:采样模块,对数据进行均匀无放回采样;随机特征映射模块,实现训练数据和预测数据的随机特征映射;分布式线性支持向量机模块,通过将数据分成若干部分,每个部分作为一个子问题进行训练,在每个子问题上加上一致性约束,通过子问题和中心节点的通信,使得子问题解保持一致。与现有技术相比,在预测准确率相当的情况下,本发明明显快于传统的支持向量机软件LIBSVM,从而可以更高效的进行大数据的分类。 | ||
搜索关键词: | 一种 基于 交替 乘子法 分布式 数据 分类 系统 方法 | ||
【主权项】:
一种基于交替乘子法的分布式大数据分类系统,其特征在于,该系统包括采样模块、随机特征映射模块和分布式线性支持向量机模块,其中:采样模块,对数据进行均匀无放回采样,即:将n个数据进行标号并且按照标号从小到大排列到一标号数组中,对该标号数组做一个随机的置换,将置换后的数组前l个作为所采取的样本;随机特征映射模块,实现训练数据和预测数据的随机特征映射,即:输入所需的近似高斯核参数σ和需要进行特征映射的训练数据和预测数据;从w的分布
中采样出D个不同的{w1...wD},将{w1...wD}存入文本文件中;对训练数据和预测数据用上述采样出的{w1...wD}按照公式(1)进行随机特征映射;
其中,w为所求向量,wT表示w的转置,x为原始样本,将随机特征映射后的结果存于文本文件中;分布式线性支持向量机模块,通过将数据分成若干部分,每个部分作为一个子问题进行训练,在每个子问题上加上一致性约束,通过子问题和中心节点的通信,使得子问题解保持一致。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410498542.6/,转载请声明来源钻瓜专利网。