[发明专利]一种分布式实现的稀疏子空间聚类方法在审
申请号: | 201611183512.1 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106845519A | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 袁晓彤;吴杰祺;刘青山 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京纵横知识产权代理有限公司32224 | 代理人: | 董建林 |
地址: | 210044 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 实现 稀疏 空间 方法 | ||
1.一种分布式实现的稀疏子空间聚类方法,其特征在于,其方法包括:
(A)在多台计算机组成的集群上,将原始数据分配到每个计算节点上;
(B)每个计算节点选取本计算机和其他计算机的原始数据计算一个Lasso稀疏重建子问题直至问题收敛;
(C)当所有子问题由所有计算节点分工计算完成后,将计算结果向量汇总到主进程或管理节点,进行后续的带权无向图的生成和谱聚类过程,最终得到分类编号。
2.根据权利要求1所述的稀疏子空间聚类方法,其特征在于,所述步骤(A)中,将待聚类的数据或图片提取特征后按列排列组成一个矩阵,得到所述原始数据。
3.根据权利要求1所述的稀疏子空间聚类方法,其特征在于,所述步骤(B)中,各个计算节点将原始数据用不同的序号分割,每个计算节点再从其他节点复制所有其他节点的原始数据,以得到求解Lasso稀疏重建需要的数据。
4.根据权利要求1或3所述的稀疏子空间聚类方法,其特征在于,所述步骤(B)中,每个计算节点独立运行,用坐标下降法求解各自的Lasso问题;如果是单机并行计算,可通过多核cpu并行计算。
5.如权利要求1或2所述的稀疏子空间聚类方法,其特征在于,所述步骤(A)中,原始数据的生成方法为:设在D维欧几里得空间RD中有n个线性的子空间其维度分别是给定一个具有N个无噪声的数据点集合这些数据点取自n个子空间中,则原始数据矩阵Y包括所有数据点:
Y=[y1,y2,...,yN]
其中,是维度为dl的矩阵,矩阵的元素来自于Sl且满足Nl>dl;。
6.如权利要求5所述的稀疏子空间聚类方法,其特征在于,所述步骤(B)中,计算一个Lasso稀疏重建子问题的子空间稀疏表达系数为:
min||ci||1
s.t.yi=Y-ici,cii=0
将每部分写成整体形式,并考虑加性噪声,则得到如下优化:
minλ||C||1+||E||2
s.t.Y=YC+E,diag(C)=0
其中,ci稀疏解,Y为原始数据矩阵;C为所有ci组成的矩阵,E为误差或噪声。
7.如权利要求6所述的稀疏子空间聚类方法,其特征在于,所述各个计算节点将原始数据用不同的序号分割,其方法为:建立一个带权无向图g=(v,ε,W),其中v定义为此带权无向图关于N个数据点的N个节点,定义为每个节点之间的边界的集合,W∈RN×N是一个对称且非负的对称矩阵,并作为一个相似度矩阵W来表示边界的权重;相似度矩阵W由下式给出:
W=|C|+|C|T
最后对相似度矩阵W通过谱聚类算法得出聚类结果。
8.如权利要求4所述的稀疏子空间聚类方法,其特征在于,所述坐标下降法的方法为:寻找一个目标函数的局部最小值,先选定一个坐标方向xi,并固定其他所有的方向x-i,对当前坐标方向一维搜索,优化,再选定xi+1,固定其他的坐标再计算,循环直到目标函数稳定。
9.如权利要求7所述的稀疏子空间聚类方法,其特征在于,每个计算节点求解各自的Lasso问题,分布式后的最优解为:令
其中,每个计算节点序号是R,R∈{R=1,2,...,P},计算节点的数目为P
Ψ=Y-iTY-i,i为样本序号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611183512.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:96V电动车全自动发电
- 下一篇:一种高启动转矩笼型异步电动机转子冲片