[发明专利]一种基于局部标签信息的半监督非重叠社区发现方法在审
申请号: | 201810954439.6 | 申请日: | 2018-08-21 |
公开(公告)号: | CN109067588A | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 李建平;顾小丰;胡健;张马路;杨久东;薛庆弢;周望;娄泽宇 | 申请(专利权)人: | 电子科技大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;G06N99/00 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 陈选中 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社区发现 准确度 算法 局部标签 时间复杂度 先验信息 半监督 非重叠 社区结构 网络 | ||
本发明公开了一种基于局部标签信息的半监督非重叠社区发现方法。本发明与传统LPA算法相比在准确度方面有所提高,而且,加入局部标签先验信息的算法与未加入先验信息的算法相比,社区发现准确度明显要提高很多。特别是当网络中社区结构不明显的情况下,本发明所提出的算法依然可以达到较高的社区发现准确度。本发明的时间复杂度为O(m),故本发明虽然提高了社区发现准确度但时间复杂度并没有增加。
技术领域
本发明涉及社区发现方法技术领域,具体涉及一种基于局部标签信息的半监督非重叠社区发现方法。
背景技术
现实世界里,许多复杂系统都可以被描述成复杂网络的形式。社区结构作为复杂网络的重要特性之一,在人们的生活中扮演着重要的角色。及时、准确的发现网络中所隐藏的社区结构,进而分析复杂系统的内部特征,不仅可以指导人们的生产活动,而且对于理解并控制复杂系统也有很大的帮助。
传统的社区发现算法由于时间复杂高、划分结果准确率低、需要事先指定社区规模等原因而不能得到广泛的应用。
传统社区发现方法有LPA算法,LPA算法的时间复杂度为O(m)。与以往的社区发现算法相比,LPA算法大大减少了运算的时间,其线性的时间复杂度使得大规模网络中的社区发现成为可能。虽然LPA算法的时间复杂度很低,但其在标签传播过程中,仅仅考虑了网络中邻居节点的标签信息,这就使得当邻居节点中出现频率最大的标签不止一个时,其会从出现频率最大的标签集中随机选取一个标签来作为当前节点的标签。尤其是在处于社区边缘的节点较多的网络,由于节点处于两个不同的社区之间,其随机选择性概率更大,更容易造成社区划分的准确率不高。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于局部标签信息的半监督非重叠社区发现方法解决了传统的社区发现算法由于时间复杂高、划分结果准确率低、需要事先指定社区规模的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于局部标签信息的半监督非重叠社区发现方法,包括以下步骤:
S1、结合网络中的must-in、cannot-in标签先验信息,将网络G(V,E)中的节点对加入到含有must-link和cannot-link先验信息的节点对集合DT和DN,并构造网络的社区相同矩阵M;
S2、从网络G(V,E)中任意选择一个节点vi;
S3、找到节点vi的邻居节点集neighbor(vi),当存在vj∈neighbor(vi),使得(vi,vj)∈DT时,则l(vi)←l(vj),l()为节点标签集;
S4、当节点vi不存在带有正标签的邻居节点,存在vk∈neighbor(vi),且(vi,vk)∈DN,则将l(vk)从其邻居节点标签集上删去,从余下的标签集中选择出现频率最大的标签作为节点vi的社区归属;
S5、当网络G(V,E)中的任意一个节点的标签是其邻居节点中出现频率最大的标签时,结束该方法,否则返回步骤S2。
进一步地:所述步骤S5中的标签包括正标签和负标签,所述正标签包括must-in和must-link标签,所述负标签包括cannot-in和cannot-link标签。
进一步地:所述网络G(V,E)的节点对为D,D=DT∪DN∪DU,DU为网络中不确定具体关系的节点对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810954439.6/2.html,转载请声明来源钻瓜专利网。