[发明专利]重叠社区检测方法、装置、电子设备及存储介质在审
申请号: | 202110660201.4 | 申请日: | 2021-06-15 |
公开(公告)号: | CN115484198A | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 张静宜 | 申请(专利权)人: | 中移系统集成有限公司;中移雄安信息通信科技有限公司;中国移动通信集团有限公司 |
主分类号: | H04L43/50 | 分类号: | H04L43/50;H04L41/14 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张睿 |
地址: | 050000 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 重叠 社区 检测 方法 装置 电子设备 存储 介质 | ||
本发明提供一种重叠社区检测方法、装置、电子设备及存储介质,重叠社区检测方法包括:基于PageRank算法,确定目标网络中各节点的标签的更新顺序;基于所述更新顺序,对所述目标网络中各节点的标签进行目标次数的更新,获取各节点的标签列表;基于所述各节点的标签列表,获取所述目标网络的重叠社区检测结果。本发明提供的重叠社区检测方法、装置、电子设备及存储介质,通过确定目标网络中各节点的标签的更新顺序,基于更新顺序进行标签传播,能降低标签传播过程中节点间形成的干扰力,能消除通常的标签传播算法因随机确定更新顺序造成的不稳定性,能获得更稳定、准确的重叠社区检测结果。
技术领域
本发明涉及计算机技术领域,尤其涉及一种重叠社区检测方法、装置、电子设备及存储介质。
背景技术
复杂网络的社区识别已成为大数据领域研究的热点问题之一,它对于复杂网络的拓扑结构分析、功能分析和行为预测都具有重要的理论意义和行为意义。社区由一系列特定的节点组织构成,学术上称之为“社区化”。
内部社区间共同享有网络中的关键节点,具有该特征的社区叫做重叠社区,而这些共享的关键节点叫做重叠节点。现有重叠社区检测方法通常是基于SLPA(Speaker-listener Label Propagation Algorithm)实现的,但基于SLPA的重叠社区检测的检测结果不稳定,即对相同的网络进行多次检测获得的检测结果的差异可能很大。
发明内容
本发明提供一种重叠社区检测方法、装置、电子设备及存储介质,用以解决现有技术中检测结果不稳定的缺陷,实现获得稳定性更好的重叠社区检测结果。
第一方面,本发明提供一种重叠社区检测方法,包括:
基于PageRank算法,确定目标网络中各节点的标签的更新顺序;
基于所述更新顺序,对所述目标网络中各节点的标签进行目标次数的更新,获取各节点的标签列表;
基于所述各节点的标签列表,获取所述目标网络的重叠社区检测结果。
在一个实施例中,更新所述节点的标签,具体包括:
在本次更新传播至所述节点的标签中出现频次最高的标签不少于2个的情况下,分别获取所述节点与所述出现频次最高的标签对应的每一邻居节点之间的相似性;
基于所述相似性,确定本次更新所述节点的标签的结果。
在一个实施例中,所述基于PageRank算法,确定目标网络中各节点的标签的更新顺序,具体包括:
所述基于PageRank算法,通过迭代,分别获取每一所述节点的PR值;
基于各所述节点的PR值,确定所述更新顺序。
在一个实施例中,每次迭代,获取节点i的PR值的公式为
其中,PR(i)表示节点i的PR值;n表示目标网络中节点的数量;α为预设的常数,0α1;M(i)表示节点i的邻居节点的集合;节点j是节点i的邻居节点;PR(j)表示节点j的PR值;d(j)表示节点j的度。
在一个实施例中,获取所述节点与所述出现频次最高的标签对应的邻居节点之间的相似性的公式为
其中,节点j是节点i的邻居节点;sim(i,j)表示节点i与节点j之间的相似性;Γ(i)表示节点i的邻居节点的集合;Γ(j)表示节点j的邻居节点的集合。
在一个实施例中,所述基于所述相似性,确定本次更新所述节点的标签的结果,具体包括:
在所述相似性的最大值的出现频次为1的情况下,将所述最大值对应的标签确定为本次更新所述节点的标签的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移系统集成有限公司;中移雄安信息通信科技有限公司;中国移动通信集团有限公司,未经中移系统集成有限公司;中移雄安信息通信科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110660201.4/2.html,转载请声明来源钻瓜专利网。