[发明专利]一种基于MDL的增量式动态社区快速发现方法及系统在审
申请号: | 201210572016.0 | 申请日: | 2012-12-25 |
公开(公告)号: | CN103902547A | 公开(公告)日: | 2014-07-02 |
发明(设计)人: | 卢彦熹;赵中英;冯圣中;潘正祥 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 宋鹰武 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 mdl 增量 动态 社区 快速 发现 方法 系统 | ||
技术领域
本发明属于互联网通信领域,尤其涉及一种基于MDL的增量式动态社区快速发现方法及系统。
背景技术
社会网络最初来自于社会学理论,是指个人之间的关系网络。现代科学技术的高速发展促进和深化了人与人之间的交流和联系,尤其是近些年来,互联网的应用普及催生了各种各样的社会网络,如微博网络、论文合著网络、车载平台网络等。如何在此类大规模社会网络中获得有价值的社区信息,成为社会学、计算机、生物科技等多领域研究者近几年广泛关注的研究方向。
从当前研究现状看,静态社区的研究已经基本趋于成熟,现有技术中已经存在的社区发现方法也大多是针对静态网络的,例如基于图划分的谱二分法、K-L算法、团过滤算法等。这些算法只针对静态社区进行分析,不能应用到实际情况下动态社区的发现。
然而,在实际应用中更迫切需要发现动态社会网络中的社区成员或社区演化模型。目前针对动态社区发现的模型也有一些,例如Chakrabarti等2006年提出的进化聚类算法及其优化模型;Manish Gupta等人基于书目合著网的分析提出了一个基于星型图式的社区发现算法ENetClus。
本发明的发明人发现:以上这些研究的一个普遍问题在于,社区与社区的演化是分开研究的,即将连续时间分割成一些离散的时间步,对每一个时间步的网络分别计算其静态社区结构,如此一来势必增加了计算消耗。另外,以上这些方法还需要事先设定诸如社区数量、社区规模等参数,这对大规模社交网络来说是非常困难的。
此外一些学者提出的动态社会网络中发现社区结构的增量识别算法IC:在已知上一时刻网络社区划分的情况下,对增量相关的节点重新计算其社区归属,并用一个阈值控制历史信息与当前网络的实际结构在确定某节点所属的社区时的重要程度,然而该比例该阈值需用户自己事先选取,阈值的不同会影响最终社区划分的结果,因此该算法缺乏良好的自动性。另外也有一些学者提出了GraphScope算法,利用信息论中最短描述长度(Minimum Description Length,MDL)原理来解决动态演化图中如何发现社区并监测社区变化的问题。该方法虽然不用自定义参数,但它是将每一个时刻的快照图作为图流的形式进行操作来发现动态社区及其演变,这样势必加大了运算量,并且对于每一个快照之间的时间间隔很难把握。
发明内容
有鉴于此,本发明实施例提供一种基于MDL的增量式动态社区快速发现方法及系统,旨在克服现有方法中需要事先设定社区个数等参数,即仍然缺乏自主性以及基于时间快照的划分方法中缺乏对动态社区演化细节的捕捉与重复计算量大的缺点。
为此,本发明实施例提供了如下技术方案:
一种基于MDL的增量式动态社区快速发现方法,包括:
根据动态社会网络初始拓扑结构将社交网络按其拓扑结构抽象为n×n的对称矩阵,其中n表示节点个数,值为1时表示节点之间有边相连,否则为0,对于孤立的结点,其对应的行和列值均为0;
按照MDL原则对各节点进行重排合并得到相应社区结构;以及
根据后续网络的动态演化按照增量式方法更新当前时刻各社区结构。
另外,本发明实施例还进一步提供了如下技术方案:
一种基于MDL的增量式动态社区快速发现系统,包括:
数据建模模块,用于根据动态社会网络初始拓扑结构将社交网络按其拓扑结构抽象为n×n的对称矩阵,其中n表示节点个数,值为1时表示节点之间有边相连,否则为0,对于孤立的结点,其对应的行和列值均为0;
社区划分模块,用于按照MDL原则对各节点进行重排合并得到相应社区结构;以及
社区增量更新模块,用于根据后续网络的动态演化按照增量式方法更新当前时刻各社区结构。
相对于现有技术,本发明实施例提供的基于MDL的增量式动态社区快速发现方法及系统具有以下优点:(1)基于信息论MDL原理,能够根据给定的社会网络图及其拓扑结构自动地确定社区数量并获得相应社区,而无需用户事先指定诸如社区个数、社区规模之类的参数,避免了人为的不恰当干预;(2)在持续变化的网络环境下,基于增量式的方法能够捕捉到社区变化的相应细节,并且在更新当前社区结构的过程中只需进行较小规模的更新计算,避免重复计算当前整个网络的拓扑属性来获得社区结构,具有更好的时间连续性和更小的计算复杂性。
附图说明
图1是本发明第一实施例提供的基于MDL的增量式动态社区快速发现方法的方法流程图;
图2是图1所示步骤101中社会网络数据建模及形式化表示之示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210572016.0/2.html,转载请声明来源钻瓜专利网。