[发明专利]一种基于特征向量中心性峰值聚类的重叠社团检测方法在审
申请号: | 201711415866.9 | 申请日: | 2017-12-25 |
公开(公告)号: | CN108229546A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 杨旭华;沈敏;陈果 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于特征向量中心性峰值聚类的重叠社团检测方法,构建网络模型;对于任意节点vi,计算特征向量中心性xi,将xi与其他节点的特征向量中心性比较,得到特征向量中心性比自己高的节点的集合,计算vi与该集合中每个点的距离,选择最小距离δi,计算节点vi的决策积按照决策积的数值对所有的节点降序排列;取决策积前β个节点作为社团中心;计算节点vi概率向量Pi,vi归属Pi中数值最大分量所对应的社团,如果概率向量的分量中,数值最大的两个分量比较接近,则该节点为同时属于相应两个社团的重叠节点;遍历网络中所有节点,完成社团划分。本发明根据特征向量中心性检测社团,算法速度快,精度高。 | ||
搜索关键词: | 中心性 特征向量 社团 概率向量 计算节点 社团检测 聚类 集合 计算特征向量 决策 遍历网络 降序排列 网络模型 重叠节点 最大分量 最小距离 构建 算法 归属 检测 | ||
【主权项】:
1.一种基于特征向量中心性峰值聚类的重叠社团检测方法,其特征在于:包括以下步骤:步骤一:构建一个网络G(V,E),V代表网络节点,E代表网络中的边,该网络的邻接矩阵为A,其中Aij是邻接矩阵中的元素,当节点vi和节点vj有连边时,Aij=1;当节点vi和节点vj无连边时,Aij=0;λ1是矩阵A的最大的特征根;步骤二:对于任意节点vi,计算其特征向量中心性遍历网络,求出网络中每个节点的特征向量中心性,作为衡量每个节点在网络中的重要性的指标;步骤三:对于任意节点vi,比较该节点的特征向量中心性vi与其他网络中节点的特征向量中心性,得到特征向量中心性比自己高的节点的集合θi,计算vi与该集合θi中每个点的距离,其中的最小值被定义为节点vi的最小距离δi,节点vi的决策积定义为遍历网络,求出网络中每个节点的最小距离和决策积,按照决策积的数值对所有的节点从高到低降序排列;步骤四:把所有的节点标注在以特征向量中心性和最小距离值为横和纵坐标的二维坐标系上,得到决策图,选择决策图右上角决策积的前β个节点作为网络的β个社团中心;步骤五:定义任意节点vi属于不同类社团的概率向量为Pi={pi1,pi2,…,pij,…,piβ},其中pij表示节点vi属于社团j的概率;因此第α个社团中心的概率向量为Pα={pα1,pα2,…,pαj,…,pαβ},其中1≤α≤β;当j=α时,pαj=1;当j≠α时,pαj=0;步骤六:对于其他未归属社团的非社团中心节点,从决策积最大的vi节点开始计算其概率向量,获取比节点vi的决策积大的节点个数为Ni个,并按和该节点的距离从小到大排序,对该Ni个节点编号为Nb为决策积大于而且与节点vi距离最近的节点个数,n0=min{Nb,Ni},j表示n0中的第j个节点,dij表示节点vi与vj之间的距离,则节点vi的概率向量为步骤七:对于节点vi,r=argmax{pi1,pi2,…,pir,…,piβ},则节点vi属于r社团,其中argmax表示取出概率向量中数值最大的分量的第二个下标;步骤八:对于节点vi,其概率向量为Pi={pi1,…,pik,…,pij,…,piβ},如果vi已经被划分到社区k中,则pik为概率向量中数值最大的分量,如果pij为概率向量中第二大的分量,而且pik‑pij<ε,ε为一个数值很小的正数,那么vi为社团k和社团j的重叠节点,即vi既属于社区k也属于社区j;步骤九:重复步骤六~步骤八,直到得到网络中所有节点找到其归属的社团。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711415866.9/,转载请声明来源钻瓜专利网。