[发明专利]一种基于粗糙集理论的改进密度峰值重叠社区发现方法有效
申请号: | 201910696981.0 | 申请日: | 2019-07-30 |
公开(公告)号: | CN110427569B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 陈红梅;封云飞;李天瑞;桑彬彬;王生武 | 申请(专利权)人: | 西南交通大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62;G06Q50/00 |
代理公司: | 成都盈信专利代理事务所(普通合伙) 51245 | 代理人: | 张澎;崔建中 |
地址: | 611756 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于粗糙集理论的改进密度峰值重叠社区发现方法,包括如下步骤:首先采用改进的节点局部密度计算方法计算网络中个节点的局部密度属性(ρ);其次采用改进的高效的节点最小距离计算策略来计算各节点的最小距离属性(δ);针对节点间距离的计算,定义了一种ND‑subspace距离衡量方法并提出了新的社区中心点选取方式;最后在密度峰值聚类上进行对网络中的节点进行社区划分和对网络中的重叠节点进行迭代计算。本发明有效地解决了重叠节点划分问题,针对节点间距离的计算定义了ND‑subspace距离衡量方法,并改进了密度峰值聚类方法以更高效的划分大规模社交网络,能够有效的解决大规模社交网络的重叠社区划分问题。 | ||
搜索关键词: | 一种 基于 粗糙 理论 改进 密度 峰值 重叠 社区 发现 方法 | ||
【主权项】:
1.一种基于粗糙集理论的改进密度峰值重叠社区发现方法,首先采用改进的节点局部密度计算方法计算网络中个节点的局部密度属性(ρi);其次采用改进的节点最小距离计算策略来计算各节点的最小距离属性(δi)并完成社区中心点;最后在密度峰值聚类上对网络中的节点进行社区划分及对重叠节点划分,最后完成目标任务解决大规模社交网络的重叠社区划分,包含以下的步骤:步骤1:输入网络
为网络的邻接矩阵;计算网络中各节点(vi)的局部密度(ρi)时,既要考虑vi的邻居个数|neib(vi)|,同时也考虑vi的邻居间的连接强度SNi,最终ρi的大小由|neib(vi)|和SNi共同决定,其计算公式如下:![]()
其中,Axy对应邻接矩阵中x和y位置的值,P(neib(vi))表示neib(vi)构成完全图时边的个数;步骤2:计算网络中各节点(vi)的最小距离δi时,需要将网络中的节点分为两类:局部峰值点(Vd)和普通点(Vn),并分别定义最小距离的计算方式;当节点vi满足条件:
那么vi被划分到Vd中,否则vi被划分到Vn中;针对Vd中的节点最小距离的计算公式为:
针对Vn中的节点最小距离的计算公式为:
步骤3:为网络中的每一个节点赋予核心值属性ci=ρi×δi,将网络中的节点按照核心值大小进行降序排列并存入List;定义中心点选择距离参数
初始化i=0并遍历List中的节点,当List.get(i)∈Vd或者
那么List.get(i)被选为中心点并继续遍历List,否则结束遍历;为网络中每一个节点都初始化一个链表labeli,用于存储节点的社区标签,并赋予中心节点不同的社区标签;选取中心点后,每一个中心节点有且仅有一个社区标签,网络中的非中心节点没有社区标签;非中心节点的社区划分划分网络中的某一节点时,仅依据其邻居节点的关系而非网络中的所有节点;对重叠节点的实施迭代划分方式,其具体步骤如下:步骤4:社区划分采用一种迭代的方式进行,这种迭代过程以重叠参数γ≤1作为迭代条件,当γ≤1时,清空网络中标签数量大于1的节点的社区标签,并执行步骤5;如果γ>1则输出最优的社区划分结构作为最终结果;步骤5:将标签为空的节点按照核心值大小降序排列,并以此作为划分过程;当划分节点vi时,首先找到距离vi最近的邻居节点vk,然后遍历vi的所有邻居节点vl∈neib(vi),当
时,将vl的社区标签赋予vi;步骤6:如果网络中所有的节点都被赋予社区标签后,那么记录当前网络的社区划分情况,并对社区结果进行评价,γ=γ+step,并执行步骤4,否则跳转步骤5。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910696981.0/,转载请声明来源钻瓜专利网。