[发明专利]一种基于特征向量中心性峰值聚类的重叠社团检测方法在审
申请号: | 201711415866.9 | 申请日: | 2017-12-25 |
公开(公告)号: | CN108229546A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 杨旭华;沈敏;陈果 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中心性 特征向量 社团 概率向量 计算节点 社团检测 聚类 集合 计算特征向量 决策 遍历网络 降序排列 网络模型 重叠节点 最大分量 最小距离 构建 算法 归属 检测 | ||
一种基于特征向量中心性峰值聚类的重叠社团检测方法,构建网络模型;对于任意节点vi,计算特征向量中心性xi,将xi与其他节点的特征向量中心性比较,得到特征向量中心性比自己高的节点的集合,计算vi与该集合中每个点的距离,选择最小距离δi,计算节点vi的决策积按照决策积的数值对所有的节点降序排列;取决策积前β个节点作为社团中心;计算节点vi概率向量Pi,vi归属Pi中数值最大分量所对应的社团,如果概率向量的分量中,数值最大的两个分量比较接近,则该节点为同时属于相应两个社团的重叠节点;遍历网络中所有节点,完成社团划分。本发明根据特征向量中心性检测社团,算法速度快,精度高。
技术领域
本发明涉及网络科学,特别是指一种基于特征向量中心性峰值聚类的重叠社团检测方法。
背景技术
现实网络不仅具有小世界和无标度等特征,且还具有社区结构特征。社区与社区之间的连接虽然较为稀疏,但是社区内部节点之间的连接却非常稠密。这种社区结构特征能够反映节点之间的局部聚集特性。由于社区内部的节点基本上都具有相似的性质或者相似的功能,因此社区结构的研究是进一步对整个复杂网络及其社区进行功能研究的基础。
目前,学者们已经提出了很多社区结构发现算法,其中比较典型的是图分割方法和层次聚类方法。图分割方法包括基于拉普拉斯图特征值的谱平分法;层次聚类方法根据网络中是否加边可以分为两大类:一类是凝聚算法,另一类是分裂算法。其中,分裂方法在实现社区划分过程中主要是按照某种标准来判断是否移除某边,而这个标准主要分为边介数、边聚类系数以及边信息中心度三类。GN算法是典型的分裂方法,该算法就是按照边介数最大的先移除的办法进行的。随着对社区发现的深入研究,Newman等提出了模块度函数,随后又出现了某些基于模块度极值优化的方法,如CNM算法、BGLL算法。然而,在现实生活中的网络,其节点并不是完全只属于某一个社区,而是可能属于多个社区,也就是说网络中存在着重叠部分。因此,学者们为了能更加真实地刻画网络的结构特征,又提出了许多重叠社区划分方法。如CONGA算法、GCE算法、LFM算法等。
发明内容
为了克服已有的重叠社团检测算法检测结果精确度不高、实时性较差的不足,本发明提出了一种考虑了快速收敛的基于特征向量中心性峰值聚类的重叠社团检测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于特征向量中心性峰值聚类的重叠社团检测方法,包括以下步骤:
步骤一:构建一个网络G(V,E),V代表网络节点,E代表网络中的边,该网络的邻接矩阵为A,其中Aij是邻接矩阵中的元素,当节点vi和节点vj有连边时,Aij=1;当节点vi和节点vj无连边时,Aij=0;λ1是矩阵A的最大的特征根;
步骤二:对于任意节点vi,计算其特征向量中心性遍历网络,求出网络中每个节点的特征向量中心性,作为衡量每个节点在网络中的重要性的指标;
步骤三:对于任意节点vi,比较该节点的特征向量中心性vi与其他网络中节点的特征向量中心性,得到特征向量中心性比自己高的节点的集合θi,计算vi与该集合θi中每个点的距离,其中的最小值被定义为节点vi的最小距离δi,节点vi的决策积定义为遍历网络,求出网络中每个节点的最小距离和决策积,按照决策积的数值对所有的节点从高到低降序排列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711415866.9/2.html,转载请声明来源钻瓜专利网。