[发明专利]基于频繁项集挖掘的核心节点发现方法无效
申请号: | 200810244678.9 | 申请日: | 2008-12-11 |
公开(公告)号: | CN101446978A | 公开(公告)日: | 2009-06-03 |
发明(设计)人: | 王崇骏;刘红星;宋文军;谢俊元 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京天翼专利代理有限责任公司 | 代理人: | 汤志武;王鹏翔 |
地址: | 210093*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 频繁 挖掘 核心 节点 发现 方法 | ||
1、基于频繁项集挖掘的核心节点发现方法,其特征是包括如下步骤:
1)项集生成阶段:
a)取得多个时间点的网络快照;时间点的选择需要用户根据网络变化情况和网络的规模来综合指定,保证各个时间点的网络既能反应网络的动态性又不至于打破原有的团伙结构。
b)针对每个时间点的网络快照都进行如下操作;
i.得到网络快照对应节点之间的关联图;
ii.提取关联图中所有的伽马准团;
iii.把每一个关联准团所对应的节点组合作为一个项集加入到项集集合
2)核心节点发现阶段:
a)把生成的项集集合作为最大频繁项集挖掘的初始集合;
b)把项集集合表示成位图向量的形式;
c)生成最大频繁项集;
d)结束;
其中:步骤1-b)中伽马准团的提取的具体过程如下:
1)通过设定最大迭代次数maxIterator来决定要运行的次数。迭代部分包换两个部分,一个是构造阶段,一个是局部搜索阶段。
2)判断是不是达到迭代次数,如果达到就退出,否则这继续从第3步开始运行。
3)最大准团的构造阶段,初始化一个元素的子图。
4)判断当前的子图是不是满足给定的紧密度要求,如果不满足说明构造阶段结束,进行第8)步开始的局部搜索阶段。
5)求得当前子图的邻居节点,邻居节点集合的每个节点要求与当前子图的节点之间也是紧密相连的。
6)从当前的邻居节点中随机选择一个加入到子图集合中来扩大初始的子图集合
7)求出新加入节点后的子图的紧密度。
8)局部搜索阶段,由构造阶段的生成初始最大准团作为出发点,寻找新的最大准团。局部搜索通过交换的方式来在生成的子图基础上寻找更大的子图。
9)寻找当前子图中有没有可以交换出去的元素。如果有的话就进行第10)步,否则表示局部搜索阶段结束。
10)是从当前子图中删除一个元素来形成新的伽马准团。
11)按照与第5)步同样的方法求得当前伽马准团的所有邻居。
12)从11)步生成的邻居中选择两个来替换10步中删除的元素。
13)把新加入的节点加入到候选伽马准团中
14)在每次迭代之后和上次迭代的结果进行对比,如果发现了更长的准团的话,就更新这个准团。
步骤2-b)的具体流程如下:
1)生成初始候选k-频繁项集,初始k为3即得到候选3-频繁项集。
2)开始进入以下第3-11)步的迭代生成最大频繁项集的流程。
3)判断当前的候选k-频繁项集集合是否为空,如果为空表示最大频繁项集生成结束,否则则继续进行最大频繁项集的生成。
4)从以下第5)步从候选的最大频繁项集中寻找最大频繁项集的过程。
5)取出一个未处理的候选最大频繁项集。如果是频繁的则加入到最大频繁项集集合中,并从候选的最大频繁集合中删除这个元素,否则继续取下一个待处理的候选最大频繁项集。
6)以下7)和8)步是循环处理候选K-项集的过程。
7)从当前的候选k-频繁项集集合中取出一个候选k-频繁项集
8)取出的候选k-频繁项集是否是频繁项集,取出的项集是频繁的话则加入到频繁k-项集集合中,否则的话这加入到非频繁k-项集集合中。
9)使用第8)步生成的非频繁k-项集集合来更新最大候选频繁项集MFCS,对MFCS中的元素进行拆分,生成长度更短的最大候选频繁项集MFCS。
10)生成下一轮的候选k+1-项集。
11)使用生成的最大频繁项集对生成的候选k+1-项集进行剪枝叶。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810244678.9/1.html,转载请声明来源钻瓜专利网。