[发明专利]一种基于混合跳转的社交网络采样方法在审
申请号: | 201810259230.8 | 申请日: | 2018-03-27 |
公开(公告)号: | CN108446996A | 公开(公告)日: | 2018-08-24 |
发明(设计)人: | 刘良桂;王玲敏;贾会玲;张宇 | 申请(专利权)人: | 浙江理工大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310018 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 采样 社交网络 跳转 采样效果 三次样条 设置参数 性能研究 度分布 社交网 样本集 子网络 三维 抽样 重复 研究 | ||
1.一种基于混合跳转的社交网络采样方法,其特征在于,该方法包括如下步骤:
第一步:跳转节点集收集:
首先,选取N个不同的初始节点,采用BFS方法对社交网络分别进行N次采样,随机组合成样本集;然后,将所收集的数据中相同度的节点数据聚合到一个例表中,这个列表为k度跳转列表,其中k为节点的度值;定义跳转节点集为V’,其数据量为|V’|;
第二步:随机选取初始节点开始进行采样;
第三步:记录当前节点v和其所有邻居节点w;
第四步:随机挑选一个邻居节点,判断当前邻居节点w是否入样,如果α<Qvw,其中α是[0,1]分布的随机数,采样进行到w节点,将w加入采样列表S;否则,进行第五步;
第五步:引入跳转度p判断采样是自循环,还是执行跳转策略,当β<p时,其中β是[0,1]分布的随机数,采样进行自循环,这意味着从当前节点v的其他邻居节点进行采样;否则,执行跳转策略,跳转到搜集的跳转节点列表中的节点。
第六步:重复执行第三至五步,直到获取足够的节点采样结束。
2.根据权利要求1所述的一种基于混合跳转的社交网络采样方法,其特征在于,所述跳转度p和跳转节点列表的参数确定方法如下:
步骤一:采用三次样条插值方法,对离散平均度数据点进行三维建模,从而得到平均度随跳转度p和采样k度跳转列表变化的三维平均度分布图;
步骤二:根据三维平均度分布图,找出样本的平均度随跳转度p和采样k度跳转列表变化的规律,确定跳转度p和采样k度跳转列表参数的最优值,在这里借助UNI方法衡量原始网络的平均度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江理工大学,未经浙江理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810259230.8/1.html,转载请声明来源钻瓜专利网。