[发明专利]一种基于多标签传播的重叠社团挖掘方法在审
申请号: | 201810546690.9 | 申请日: | 2018-05-31 |
公开(公告)号: | CN108898506A | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 王林;饶仁杰 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F17/30 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 宁文涛 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 社团 挖掘 传播 相似性矩阵 标签更新 复杂网络 更新策略 节点分配 重叠节点 传统的 排序 网络 更新 | ||
1.一种基于多标签传播的重叠社团挖掘方法,其特征在于,具体步骤如下:
步骤1、初始化阶段,利用LeaderRank方法计算出网络中所有节点的LR值,并按LR值的降序对所有节点进行排序,从而确定更新顺序,并给每一个节点分配一个唯一的标签;
步骤2、设计标签传播策略,根据步骤1中得到的节点排列顺序,计算每个节点与其相邻节点的节点相似性,开始传播更新标签直至标签数量达到最小;
步骤3、进行社团划分,拥有相同标签的节点属于同一个社团,具有多个标签的节点属于重叠节点,重叠节点所在的社团为重叠社团。
2.根据权利要求1所述的一种基于多标签传播的重叠社团挖掘方法,其特征在于,步骤1的具体步骤为:
步骤1.1、先在所述网络中加入一个背景节点,将其与网络中的所有节点相连,得到一个N+1个节点的强连接网络;
步骤1.2、给除背景节点以外的每个节点均分配1单位的LR值;
步骤1.3、将步骤1.2中分配给每个节点的1单位的LR值平均分配给其所有邻居节点;
步骤1.4、将步骤1.3中分配到每个节点的LR值再平均分配给其所有邻居节点;
步骤1.5、重复步骤1.4中的过程,直至网络中所有节点的LR值达到稳定状态,此时,每一个节点i的LR值为:
其中,N(i)表示节点i的邻居节点集合,j为节点i的邻居节点集合中任意一个节点,kj表示节点j的度,sj(t)表示第t次迭代节点j的LR值,si(t+1)表示第t+1次迭代节点i的LR值;
步骤1.6、将背景节点的LR值平均分配给除背景节点外的所有节点,此时,每一个节点i的LR值为:
其中,tc表示收敛次数,Si表示收敛时节点i的最终LR值,si(tc)表示第tc次迭代节点i的LR值,sg(tc)表示稳定状态下背景节点g的LR值,N表示网络中的节点数量;
步骤1.7、将不包括背景节点在内的所有节点按照LR值降序排序,并给每一个节点分配一个唯一的标签(cx,bx),其中cx节点所在的社团为cx,bx表示节点属于社团cx的从属系数,初始时bx为1。
3.根据权利要求1所述的一种基于多标签传播的重叠社团挖掘方法,其特征在于,步骤2具体步骤为:
步骤2.1、计算出步骤1.7中得到的节点排列顺序中所有节点与其邻居节点间的节点相似性,得到相似性矩阵:
其中Γ(x)表示节点x的邻居节点与节点x本身构成的集合,Γ(y)表示节点y的邻居节点与节点y本身构成的集合;
步骤2.2、开始传播标签,假设节点x的标签为(cx,bx),节点x有邻居节点y、邻居节点z……邻居节点w,且每个邻居节点的标签分别为(cy,by)(cz,bz)......(cw,bw),节点x与邻居节点y、邻居节点z……邻居节点w之间的节点相似性均为u,标签从节点x的所有邻居节点传播到节点x,传播过程中每个邻居节点的从属系数分别乘以该邻居节点与节点x之间的节点相似性;
得到节点x更新后的标签集合:
Lx:{(cy,u×by),(cz,u×bz)......(cw,u×bw)}
步骤2.3、设定阈值p,当u×bw<p时,删除标签,当u×bw≥p时,则保留标签,最后对节点x的标签从属系数进行标准化;
其中,u×bw表示节点x的标签集合Lx中第w个标签的从属系数,n表示节点x的标签数量;
步骤2.4、重复步骤2.2和步骤2.3的标签传播过程,直至标签数量达到最小值,停止传播。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810546690.9/1.html,转载请声明来源钻瓜专利网。