[发明专利]一种基于顶点切割与社区聚集的大规模图划分方法有效
申请号: | 201310686371.5 | 申请日: | 2013-12-16 |
公开(公告)号: | CN103699606A | 公开(公告)日: | 2014-04-02 |
发明(设计)人: | 谢夏;金海;吴延赞;柯西江 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 朱仁玲 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 顶点 切割 社区 聚集 大规模 划分 方法 | ||
1.一种基于顶点切割与社区聚集的大规模图划分方法,应用于包括网页数据和网络文献关系在内的大规模迭代图,包括以下步骤:
(1)初始化划分集群,包括设定集群软硬件的参数,启动集群,划分算法代码部署;
(2)定时检测划分节点,利用定时间隔的心跳检测,查看各个计算节点是否在线,确保集群运行正常,并将待划分图发送到集群中;
(3)统计待划分图的顶点度数分布,得到该待划分图的分布特性,即其Power-Law分布参数,根据该分布参数得到具体的顶点切割方案;
(4)根据切割方案进行顶点切割,得到切割图;
(5)获取切割完成后的图;
(6)对切割之后的图迭代地进行标签传播处理;
(7)获取标签传播图,并进行MGP划分,以巩固顶点切割以及社区聚类的效率;
(8)重复步骤(3)至步骤(7)直到迭代次数达到预定次数。
2.根据权利要求1所述的划分方法,步骤(1)中,所述集群软硬件参数包括计算节点的磁盘大小、内存大小、IP地址和镜像目录。
3.根据权利要求1所述的划分方法,所述步骤(4)具体包括:
(4-1)初始化参数,包括要切割的顶点集V、顶点之间的关联,即边集E、已经分配的边集E′和切割的顶点集合标号,也即集群的节点集合K={1,2,…,k},对顶点为u,v的任意边,即(u,v)←e,初始化将顶点u已经被放置的所有的节点的集合初始化为空集,且
(4-2)读取所述顶点为u,v的边,对其两顶点的已分配集合即A(u),A(v)做出如下决策:若两者均非空且无交集,则选择两者并集中负载最小的一个节点作为顶点分割后将要分配到的节点;若两者中有一个为空,则选择不为空集合中负载最小的节点;若两者均不为空且有交集时,则选择交集中负载最小的节点;
(4-3)根据上一步骤的决策进行顶点切割,也即将顶点切割出一个镜像,连同该边连着的另一个顶点,一同分配到步骤(4-2)中决策所选择的计算节点中;
(4-4)动态更新顶点的已分配集合A(u),A(v),作为下一次分配的输入参数;
(4-5)重复执行步骤(4-2)至(4-4),直到所有的顶点完成切割及所在的边完成分配,即可获得切割完成之后的分布式图;
(4-6)整理切割完毕之后的图,作为标签传播的输入。
4.根据权利要求3所述的划分方法,其中,所述整理包括统一输出文件中图的表达方式,标定已切割顶点。
5.根据权利要求1所述的划分方法,所述步骤(6)具体包括:
(6-1)将得到的图进行初始标签化处理,即将每个顶点的标签初始化为其对应的id值,作为最初的社区标记;
(6-2)根据图的结构进行标签扩散,直至所有的顶点都已经处理完成;
(6-3)将顶点u的标签Pu更新为对其影响力最大的标签值,其中,所述影响力为标签所指顶点出度的倒数;
(6-4)重复执行(6-2)至(6-3)直到所有的顶点的标签值不再变化为止,得到标签传播图。
6.根据权利要求5所述的划分方法,其中,所述标签扩散的扩散规则为:对于顶点的标签Pu,将其对相邻顶点的影响力置为
7.根据权利要求5所述的划分方法,其中,所述步骤(6-3)具体包括:获取该顶点所有入度顶点的标签以及该标签对该顶点的影响力,然后对各个顶点根据其所有相邻顶点标签对其影响力,按标签值为key进行分类求和,排序得到Pmax,则Pu=Pmax。
8.根据权利要求1所述的划分方法,所述步骤(7)具体包括:
(7-1)根据标签传播结果,对结果图做初始化处理,即将标签值相同的顶点做聚集,得到一个缩合图;
(7-2)对缩合图进行迭代粗化,直到结果图的大小适用于KL/FM算法;
(7-3)利用KL/FM算法进行划分;
(7-4)根据各顶点保存的内容迭代地进行反粗化,得到已经被划分的原始图;
(7-5)得到MGP划分图。
9.根据权利要求8所述的划分方法,所述步骤(7-2)中,采用零边匹配方法进行迭代粗化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310686371.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:纺织用缝纫装置
- 下一篇:CKD/SKD清单自动生成方法