[发明专利]一种新型社会网络采样方法在审
申请号: | 201510114130.2 | 申请日: | 2015-03-16 |
公开(公告)号: | CN104715418A | 公开(公告)日: | 2015-06-17 |
发明(设计)人: | 童超;连宇;牛建伟;谢忠玉;张杨 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 祗志洁 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新型 社会 网络 采样 方法 | ||
技术领域
本发明提出一种可以保持社区结构的基于社会网络的采样方法,属于复杂网络技术领域。
背景技术
近年来人们发现,各种各样的社交网络(complex network)不断地涌现,如新浪微博,微信,人人网等。通常社交网络有复杂的结构和数以万计的节点。除此之外,复杂网络的节点和边可能是动态变化的。例如微博等社交网络中有数亿个节点和无数动态变化的好友关系。在中国至少已经有10亿的QQ用户,并在进一步扩大中,而且用户之间的好友关系也在不断地变化。因此,如何处理超大规模的社交网络数据,已经成为研究者亟待解决的关键科学问题之一。
社区结构已成为社交网络最普遍和最重要的拓扑结构属性之一。通常来说,网络社区结构具有社区内部节点相互连接紧密、社区之间节点连接稀疏的特点。研究复杂网络社区结构对于研究复杂网络具有重要的理论意义。同时,社区结构研究已被应用于恐怖组织识别、社会网络分析与管理、未知蛋白质功能预测、好友推荐、主控基因识别、推荐系统以及Web社区挖掘和搜索引擎等众多领域,具有极其广阔的应用前景。
发明内容
由于网络的结构日益复杂,数据越来越多,直接在原始网络上进行计算对计算能力和存储空间有巨大的要求,而且大多数目前的采样方法都没有将保持社区结构作为目标。本发明提出了一种新型社会网络采样方法,以实现能较好地维持原网络的社区结构的前提下,很大程度上减小需要处理的数据规模,适用于由于现有硬件条件的限制下对大规模数据分析的数据采样。
将社区网络用无向无权图G=(V,E)表示,V表示网络中节点集合,E表示网络中边集合,设网络中节点总数为n,边总数为m,用(μ,ν)表示网络中的一条边,μ,ν∈V;对于V中任一节点v,设节点v的度数为kv。
首先定义社区聚集系数和社区聚集中心两个概念:
社区聚集系数定义为节点任意两个邻居是好友的概率,节点v的社区聚集系数CCv为:
其中节点i和节点j是节点v的任意两个邻居节点,e(i,j)用于标记节点i和节点j是否是邻居节点关系,若是e(i,j)的值为1,否则e(i,j)的值为0;
社区聚集中心定义为社区聚集系数极大值的网络节点,如果节点v的社区聚集系数大于等于它的所有邻居节点的社区聚集系数,节点v被称为社区聚集中心。
本发明提供的一种新型社会网络采样方法,实现步骤为:
步骤1:遍历V中的所有节点,找到社区聚集中心;
步骤2:利用PageRank方法对V中所有节点进行排序;
步骤3:在未被采样的社区聚集中心中,选择网络排名最低的节点作为采样的起始节点;标记选取的社区聚集中心为节点v;
步骤4:设置节点v的采样大小Samsize=cur_size×Rv;其中,cur_size表示本次采样方法要求采样的节点总数,Rv表示节点v的采样比例;Rv通过下式确定:
其中,Nv表示节点v的邻居节点的集合,Nv中节点j的度数为kj,C表示所有社区聚集中心的集合,C中节点i的度数为ki,节点i的邻居节点的集合为Ni,Ni中的节点h的度数为kh。
步骤5:利用森林火灾采样方法进行采样,当达到步骤4设置的采样大小或者没有继续烧下去的节点时,进入步骤6执行;
步骤6:判断是否达到本次采样方法要求采样的节点总数,若是,停止采样,输出采样节点;若否,继续转步骤2执行。
本发明的优点与积极效果在于:本发明的社会网络采样方法可以在能较好地维持原网络的社区结构的前提下,很大程度上减小需要处理的数据规模,大规模降低计算和存储的成本,从而为在现有的计算和存储限制条件下对大数据处理提供有效的支持。
附图说明
图1是本发明的新型社会网络采样方法的步骤流程示意图;
图2是cond-mat-2005数据集下各采样方法的NCP前6个参数的采样效果图;
图3是cond-mat-2005数据集下各采样方法的NCP后5个参数的采样效果图;
图4是cond-mat数据集下各采样方法的NCP前6个参数的采样效果图;
图5是cond-mat数据集下各采样方法的NCP后5个参数的采样效果图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;,未经北京航空航天大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510114130.2/2.html,转载请声明来源钻瓜专利网。