[发明专利]一种新型社会网络采样方法在审
申请号: | 201510114130.2 | 申请日: | 2015-03-16 |
公开(公告)号: | CN104715418A | 公开(公告)日: | 2015-06-17 |
发明(设计)人: | 童超;连宇;牛建伟;谢忠玉;张杨 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 祗志洁 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种新型社会网络采样方法,属于复杂网络技术领域。本方法适用于由于现有硬件条件的限制下对大规模数据分析的数据采样,提供了社区聚集系数和社区聚集中心两个概念,步骤包括:根据节点的社区聚集系数找出所有社区聚集中心;利用PageRank方法对所有节点进行网络排名;每次采样的起始节点选取网络排名最低的未被采样社区聚集中心;按比例设置采样大小;利用森林火灾采样方法进行采样。经过实验证明,本发明方法得到的采样结果的社区结构和原图的社区结构比较相似,较好地保持了社区结构,很大程度上减小需要处理的数据规模,大规模的降低计算和存储的成本。 | ||
搜索关键词: | 一种 新型 社会 网络 采样 方法 | ||
【主权项】:
一种新型社会网络采样方法,将社区网络用无向无权图G=(V,E)表示,V表示网络中节点集合,E表示网络中边集合,设网络中节点总数为n,边总数为m,对于V中的任一节点v,用kv表示节点v的度数;其特征在于:首先定义社区聚集系数和社区聚集中心两个概念:社区聚集系数定义为节点任意两个邻居是好友的概率,节点v的社区聚集系数CCv为:其中节点i和节点j是节点v的任意两个邻居节点,e(i,j)用于标记节点i和节点j是否是邻居节点关系,若是e(i,j)的值为1,否则e(i,j)的值为0;社区聚集中心定义为社区聚集系数极大值的网络节点,如果节点v的社区聚集系数大于等于它的所有邻居节点的社区聚集系数,则节点v被称为社区聚集中心;所述的社会网络采样方法通过以下步骤实现:步骤1:遍历V中的所有节点,找到所有的社区聚集中心;步骤2:利用PageRank方法对V中所有节点进行网络排名;步骤3:在未被采样的社区聚集中心中,选择网络排名最低的节点作为采样的起始节点;标记选取的社区聚集中心为节点v;步骤4:设置节点v的采样大小Samsize=cur_size×Rv;cur_size表示本次采样方法要求采样的节点总数,Rv表示节点v的采样比例;Rv通过下式确定:其中,Nv表示节点v的邻居节点的集合,C表示所有社区聚集中心的集合,C中节点i的度数为ki,节点i的邻居节点的集合为Ni,Ni中的节点h的度数为kh;步骤5:利用森林火灾采样方法进行采样,如果达到步骤4设置的采样大小或者没有继续烧下去的节点时,进入步骤6执行;步骤6:判断是否达到本次采样方法要求采样的节点总数,若是,停止采样,输出采样节点;若否,继续转步骤3执行。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;,未经北京航空航天大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510114130.2/,转载请声明来源钻瓜专利网。