[发明专利]一种基于局部标签信息的半监督重叠社区发现方法在审
申请号: | 201810953974.X | 申请日: | 2018-08-21 |
公开(公告)号: | CN109063173A | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 李建平;顾小丰;胡健;林思哲;杨久东;蔡京京;张建国;赖志龙 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 陈选中 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 先验信息 时间复杂度 局部标签 社区发现 重叠社区 半监督 准确度 标签信息 转换 网络 发现 传播 | ||
本发明公开了一种基于局部标签信息的半监督重叠社区发现方法。本发明充分利用了网络中的正负标签信息,并采取了异步传播机制。本发明将充分利用网络中的这些先验信息,并将部分Must‑link先验信息转换为Must‑in信息,将Cannot‑link先验信息转换为Cannot‑in信息,并以此来指导社区发现过程,本发明的时间复杂度为O(mnlog(m)),故本发明虽然提高了社区发现准确度但时间复杂度并没有增加。
技术领域
本发明涉及社区发现方法技术领域,具体涉及一种基于局部标签信息的半监督重叠社区发现方法。
背景技术
现实世界里,许多复杂系统都可以被描述成复杂网络的形式。社区结构作为复杂网络的重要特性之一,在人们的生活中扮演着重要的角色。及时、准确的发现网络中所隐藏的社区结构,进而分析复杂系统的内部特征,不仅可以指导人们的生产活动,而且对于理解并控制复杂系统也有很大的帮助。
传统的社区发现算法由于时间复杂高、划分结果准确率低、需要事先指定社区规模等原因而不能得到广泛的应用。
传统重叠社区发现方法有COPRA算法,在传统的COPRA算法中,标签的传播过程仅仅与邻居节点有关,所有邻居节点将标签传播到本节点的概率是相同的。然而,在真实情况下,与本节点的相似度越大,其将标签传播到本节点的概率也就越大。在重叠社区发现领域,传统的COPRA算法仅仅考虑了网络的拓扑结构。然而研究表明,真实网络中往往存在着少量先验信息,使得在社区发现过程中的准确率较低。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于局部标签信息的半监督重叠社区发现方法解决了传统的COPRA算法在社区发现过程中的准确率较低的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于局部标签信息的半监督重叠社区发现方法,包括以下步骤:
S1、根据Must-in和Must-link正标签先验信息初始化节点隶属矩阵n为网络中的节点数目,C为网络中的社区数目;
S2、将网络中的Must-in和Must-link正标签先验信息、Cannot-in和Cannot-link负标签先验信息都转化为网络的隶属度矩阵Fn×C以及网络中标签存在性矩阵Sn×C;
当网络中的节点vi与社区c是Must-in关系,则fic=1,否则fic=0;网络中标签存在性矩阵Sn×C的取值为:当网络中节点vi与社区c之间含有Must-in或Cannot-in信息,则sic=al,否则sic=au,0≤(al,au)≤1,al无限趋近于1,au无限趋近于0;fic∈Fn×C,sic∈Sn×C,i=1,2,...,n,c=1,2,...,C;
S3、根据网络隶属矩阵迭代执行标签传播过程,当节点vi与社区c的标签隶属关系确定时,即sic=al,不再计算节点vi的标签归属,否则,从邻居节点的标签集中获取节点vi的标签归属;
S4、根据节点vi的标签归属计算网络中的社区标签的个数,若个数改变,进入步骤S5,否则进入步骤S6;
S5、将每个社区标签的最小规模值赋给mt,并返回步骤S2;
S6、将所有社区标签的最小规模值赋给mt;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810953974.X/2.html,转载请声明来源钻瓜专利网。