[发明专利]基于标签传播的可调节重叠社团发现方法在审

专利信息
申请号: 201710653535.2 申请日: 2017-08-02
公开(公告)号: CN107392784A 公开(公告)日: 2017-11-24
发明(设计)人: 方建平;王海威 申请(专利权)人: 西安电子科技大学
主分类号: G06Q50/00 分类号: G06Q50/00
代理公司: 西安利泽明知识产权代理有限公司61222 代理人: 贾晓玲
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 标签 传播 调节 重叠 社团 发现 方法
【说明书】:

技术领域

发明涉及社交网络技术领域,特别涉及一种基于标签传播的可调节重叠社团发现方法。

背景技术

随着计算机技术和互联网的不断发展,计算机、智能手机、传感器等设备无时无刻在产生数据。普通民众接触网络的机会越来越多,各行各业也运用互联网带来的便利。这些数据呈几何级数增长,产生的海量数据。生活及生产中的各种信息,多数都可以转化为网络结构或图(Graph)结构,也就是说,网络结构无处不在。Newman将现实生活中的网络概括为四大类;通信网络,如全球资讯万维网络、电子科大图书馆馆藏检索网络等;生物网络,如生态系统中的食物链网络、人体各大机能网络——运动系统、呼吸系统、神经系统等;科技网络,如铁路运输网络、物流输运管理网络、电力系统网络等;社会网络,如家族成员关系网络、朋友圈网络等。网络是由节点和节点间的连线(也可称之为边)组成的。在不同的网络中,节点与边的含义各不相同。如:在社交网络中,节点代表用户,而边代表用户之间的好友关系;在引文网络中,节点代表论文,而边代表引用关系。

网络的功能是网络中各个社团之间综合作用的结果,我们需要知道网络的总体功能以及每个社团各自的功能,因此网络的社团结构检测对于理解复杂网络的网络结构和有深刻的理论和现实意义:能够更好地理解网络的结构;能够更清晰地认识网络中不同社团之间的关系,每个社团的功能可以由该社团内部的个体的功能来推断;一个社团的成员的功能可以由其他成员的功能来推断。而推断的过程需要使用图数据挖掘技术。通过对图数据进行挖掘分析,可以得到图的深层次信息,包括中心节点,社团结构特征等。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。

为挖掘图的结构信息,需要使用社团发现技术(或称为社团检测技术)。现有的社团发现算法有如下几大类:1、基于模块度优化的社团发现算法,更进一步可以分为凝聚算法、分裂算法和直接寻优算法;2、基于谱分析的社团发现算法,这类算法的普遍方法是将节点对应的矩阵特征分量看成空间坐标,将网络节点映射到多维向量空间去,运用传统的聚类算法将它们聚集成社团。这种方法不可避免的要计算矩阵的特征值,开销很大,但是因为能直接使用很多传统的向量聚类的成果,灵活性很高;3、基于标签传播的社团发现算法,这类算法优点在于不需要任何参数输入,而且算法具有线性时间复杂度,收敛速度非常快,适用于规模较大的复杂网络。

基于标签传播的社团发现算法在进行标签传播的过程中,每个节点的所属标签由该节点所有直接邻居节点来决定。根据邻居节点中标签的数量(或称出现频率),本地节点选择数量最多的邻居标签来更新本地节点标签。当遇到邻居节点有两种或两种以上数量相同的标签时,即产生了竞争时,采用随机选择的方式来更新本地节点标签。这种竞争处理方式仅适用于非重叠社团结构,不能有效地发现重叠社团结构。非重叠社团发现算法已经很完备了,但是真实世界的网络和这种理想状态相去甚远,经常有某些节点同时具有多个社区的特性,属于多个社区,在这种状况之下,对于重叠社区的划分明显更有意义更贴近真实世界,也因此成为近年来新的研究热点。

发明内容

为解决上述技术问题存在的不足,本发明提出一种基于标签传播的可调节重叠社团发现方法。

为达到上述技术目的,本发明采用如下技术方案:

基于标签传播的可调节重叠社团发现方法,包括以下步骤:

步骤1:用户根据需要,输入一个可调参数,根据参数的输入值来选择重叠社团检测模式或非重叠社团检测模式;

步骤2:初始化所有节点标签;

步骤3:进行标签传播;

步骤4:判断是否达到终止条件,若达到条件则输出结果,若未达到条件则返回步骤3继续迭代传播。

在步骤1中,用户根据需要,输入一个可调参数K∈R,根据参数K的输入值来选择重叠社团检测模式或非重叠社团检测模式;若参数K满足条件K∈{x|x∈[0,1],x∈R}时,程序采用重叠社团检测模式,并将模式标志位flag_mode置为0;此时,该参数用于判定重叠社团结构的程度,该参数越大,社团重叠程度越小;反之,该参数越小,社团重叠程度越大,这将影响最终的输出结果;若参数K的输入值不满足条件K∈{x|x∈[0,1],x∈R}时,即时,程序采用非重叠社团检测模式,将按照传统的基于标签传播社团发现方法对输入图进行非重叠社团检测,并将模式标志位flag_mode置为1。

在步骤2中,首先读取输入的图数据:

G=(V,E)

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710653535.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top