[发明专利]一种挖掘重叠社区动态演化关联规则的方法在审
申请号: | 201710303323.1 | 申请日: | 2017-05-03 |
公开(公告)号: | CN107239498A | 公开(公告)日: | 2017-10-10 |
发明(设计)人: | 程久军;张长柱;黄震华;刘春梅 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 上海科律专利代理事务所(特殊普通合伙)31290 | 代理人: | 叶凤 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种挖掘重叠社区动态演化关联规则的方法。复杂网络演化研究的根本目的是彻底理解网络演化的底层机制。目前的研究主要为对基本演化法则的探索,分析总体拓扑性质以及节点如何演化等。对重叠社区演化的研究局限于检测其合并、分裂、收缩、增长等动态事件,分析其演化的稳定性等,没有提出一种挖掘重叠社区动态演化关联规则的方法,也无法根据重叠社区过去的演化事件预测未来发生的变化。本发明通过挖掘复杂网络中重叠社区动态演化中的“增长分裂”、“合并后增长”等特定演化序列,给出一种动态演化关联规则的方法,从而有助于深入理解重叠社区动态特征并且预测其演化,为理解复杂网络重叠社区动态演化的底层机制提供一种新的分析工具。 | ||
搜索关键词: | 一种 挖掘 重叠 社区 动态 演化 关联 规则 方法 | ||
【主权项】:
一种挖掘重叠社区动态演化关联规则的方法,其特征在于,包括如下步骤实现:步骤1,以重叠社区作为节点、改变点作为边进行社区演化图建模通过重叠社区演化图建模,将所有社区及改变点统一表示为一个抽象的图(Graph),其中,重叠社区演化图中节点的大小对应社区成员节点个数。所述重叠社区演化图EG=(V,E)是定义在演化网络上的、以重叠社区作为节点、改变点作为边的有向无环图,且满足以下条件:1)一个重叠社区作为图中的一个节点。每个节点关联相应社区的节点数。2)演化图EG划分为n个分区,gi中的社区对应第i分区中的节点,且所有分区按时间顺序排列。3)对两个相邻分区中的节点若在一次演化中,通过合并、分裂、增长、收缩、保持等改变事件转变为则存在一条由到的有向边,且这条边关联相应事件的类型。4)每条边可以关联五种改变事件类型,即合并、分裂、增长、缩小和消失。每条边必须介于两个相邻分区的节点之间。5)为了表示社区消亡事件,用一个特殊节点表示已经消失的社区。6)演化图EG至少包含两个分区。步骤2,基于关联规则挖掘框架,定义演化子图模式、支持度、社区演化规则及置信度定义重叠社区演化子图如下:定义1重叠社区演化子图:重叠社区演化子图是定义在演化网络上的,重叠社区演化图的子集其中且满足:1)SEG至少包含一个入度为0的节点,称为源节点。2)SEG包含多个出度为0的节点,称为目的节点。3)SEG是一个连通子图,即存在一条路径由u到达v或由v到达u。因此,从源节点到任意其他类型的节点都存在一条唯一的路径。4)SEG中不存在回路,因而SEG图也可以视为一棵树。5)SEG图可以只包含社区生命期的一部分,将其起始时间记为ts,结束时间记为te(1≤ts,te≤n)。在重叠社区演化子图基础上进一步定义社区演化模式如下:定义2演化子图模式:给定重叠社区演化图一个演化子图模式是一个EG的特殊演化子图其中的一个节点匹配EG中任意节点,P中的边匹配EG中的任意边。演化子图模式P在EG中的一次出现为函数并且对所有节点u,v∈Vp满足条件:1)2)其中函数将模式P中的有向边(u,v)映射到改变点类型t。3)其中,函数sgn(·)是符号函数,|u|和|v|分别是社区u和v的大小。为了量化社区演化子图的出现次数,定义社区演化子图支持度如下:定义3演化子图支持度:给定社区演化图EG(V,E)和演化子图模式P(Vp,Ep),则P在EG中的支持度为一个函数即其中,fp表示P在EG中的一次出现,v是P中的一个节点,uv是P在EG中的一次出现,即P所匹配的子图中u所映射到的节点,表示自然数。为了挖掘出子图模式间的关联,定义子图之间的可达性。假设A(VA,EA),B(VB,EB)分别为社区演化图EG中的子图,和分别是A,B的起始时间且如果或者存在一条从A的源节点到达B中任意节点的路径则称A可达于B,记为定义子图之间的关联规则,期望从社区演化图中得到的重叠社区演化关联规则。定义4演化子图规则和置信度:给定社区演化图EG,子图模式PA和PB,演化子图A和B分别与模式PA和PB匹配,则演化子图规则即重叠社区演化关联规则定义为蕴含式且同时满足以下条件:1)PA的支持度大于最小支持度阈值∈,即σ(EG,PA)≥∈。2)演化子图A可达于B,即3)该规则的支持度为模式PA的支持度,即4)该规则服从一定的置信度,记为演化子图关联规则描述了两种子图模式在社区演化图中的关系,而它的置信度则可以度量在整个数据集中满足这种关系的规则占总数据的比值,帮助判断发现的关联规则的可信度。根据经典的关联规则框架,演化子图关联规则的置信度定义为:其中,PA∪PB表示PA和PB同时出现,即support(PA∪PB)=σ(EG,PA∪PB) (2)根据前面的定义可知,支持度满足反单调性,则有σ(EG,PA∪PB)≤σ(EG,PA)且σ(EG,PA∪PB)≤σ(EG,PB)。因此,该置信度满足条件由公式(1),演化子图关联规则的置信度取决于支持度σ(EG,PA)和σ(EG,PA∪PB)。通过搜索得到在社区演化图EG中分别匹配PA和PA∪PB的子图集合{A1,A2,…,Am}和{B1,B2,…,Bn}后,生成关联规则并检验其置信度。步骤3,搜索所有支持度高于一定阈值的子图,从而生成重叠社区动态演化关联规则重叠社区演化关联规则的挖掘分为两步:步骤31)在社区演化图中挖掘支持度高的演化子图模式;步骤32)搜索匹配一个模式的所有演化子图,生成演化子图规则并检验其置信度。步骤31,给定包含n个节点的图,在不考虑边的情况下,该图的子图数量为设定节点数限制让子图的节点数n≤ξ。演化子图挖掘的算法如下:输入社区演化图EG(V,E),最大节点数ξ,1.将EG中“合并”类型的边反向。2.检查是否将V中所有的u遍历完成,未完成则进行下一步操作;否则跳到步骤5。3.进行赋值操作:g←{u},S←segExpanding(EG,g,ξ)。返回步骤3。4.恢复EG中“合并”类型边的方向。5.输出演化子图集合SEG={g1,g2,…},其中且gi≠gj(i≠j)。6.结束程序在演化子图挖掘算法1中,针对一个子图进行扩展如算法3:算法3演化子图扩展(segExpanding)1.输入社区演化图EG,演化子图g,最大节点数ξ。2.如果nodesCount(g)=ξ,则进行下一步操作;否则跳到步骤4。3.进行赋值操作:SEG←SEG∪{g},然后跳到步骤9,返回SEG的值。4.将g中所有节点的后一级节点放入集合且5.检查是否遍历完所有的子集遍历未完成则进行下一步操作。否则跳到步骤。6.如果support(g∪W)≥minSupport,则进行下一步;否则跳到步骤。7.进行相关操作:c←g∪W,segExpanding(EG,c,ξ)。8.返回步骤5。9.输出对应的演化子图集合SEG={g1,g2,…},其中且gi≠gj(i≠j)。10.结束程序步骤32,通过迭代搜索各分区和基于回溯法的策略,完成搜索匹配一个模式的所有演化子图,生成演化子图规则并检验其置信度。步骤321,给出演化子图搜索算法1:算法1演化子图搜索算法(segSearch)1.输入网络社区演化图EG,演化子图模式P。2.进行赋值操作:3.对i从1到n进行遍历,检查是否遍历完成,若遍历未完成,则进行下一步操作;否则,跳到步骤18。4.对所有的u∈gi子节点进行遍历,检查是否遍历完成,若遍历未完成,则进行下一步;否则跳到步骤17。5.进行赋值操作:g←{u},N←descendant(u)。6.对所有满足下列条件的子集进行遍历:且存在(g∪s)匹配p。若遍历未完成,则进行下一步;否则跳到步骤14。7.对所有的v∈s子节点进行遍历,检查是否遍历完成,若遍历为完成,则进行下一步;否则跳到步骤11。8.构造以v为起点的演化网络图EGv。9.构造以v匹配节点uv起始的子模式10.进行赋值操作:Gv←segSearch(G,EGv,pv),返回步骤7。11.如果所有节点v∈s的Gv非空,则进行下一步操作;否则跳到步骤13。12.进行赋值操作:SEG←SEG∪{g∪(∪v∈s(gv))|gv∈Gv}。13.返回步骤6。14.如果不存在子集满足存在则进行下一步操作;否则跳到步骤16。15.跳到步骤18,返回空集。16.返回步骤4。17.返回步骤3。18.输出演化子图集合SEG={EG1,EG2,...},其中每个EGi都匹配P。19.结束程序。在算法1中,与模式P相匹配的子图集合为SEG,它首先初始化为空集。然后,按顺序遍历各分区中的节点u,令它与模式P中的源节点up匹配,并且将u的后继节点放入集合N。接下来在第6行的循环中,遍历N的所有的子集s且只考虑大小为|descendant(up)|的子集。在第7~10行的循环中,如果节点u合并s之后,与up合并其后继节点的子图匹配,则在以v∈s为起点的社区演化图中,搜索子模式pv,即进行递归调用。对于子集s中的每个节点v,可能返回多个匹配子模式pv的子图,这些子图用Gv表示。当集合s中的所有节点处理完成并且各节点v所对应的集合Gv均非空时,从每个集合Gv中选择一个子图,将它与g合并,从而得到与模式P匹配的社区演化子图。在算法1的第13行中,如果存在多种组合方式时,则将这些组合的演化子图都存入SEG。如果子集s中有任何节点的Gv为空,说明后半部分无法匹配,此时舍弃s。步骤322,生成演化子图规则并检验其置信度:通过执行算法3得到在一个社区演化图中支持度较高的所有子图模式,放入集合SEG。然后,对于SEG中的任意两个子图模式seg1和seg2,判断seg1是否可达于seg2,即对于互不可达的子图模式,不为这两个模式生成规则。接下来,对于可达的模式seg1和seg2,生成一条社区演化关联规则并计算其置信度当置信度低于最小值时将它舍弃。最后,保留置信度高的社区演化规则,作为所发现的社区演化关联规则。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710303323.1/,转载请声明来源钻瓜专利网。