[发明专利]一种面向社交网络的度偏置采样方法及系统在审
申请号: | 201910866302.X | 申请日: | 2019-09-12 |
公开(公告)号: | CN110717107A | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 施展;冯丹;王芳;黄世财;张芸怡;吴雨桐;朱涛;龚慧媛;何雨迪 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 42201 华中科技大学专利中心 | 代理人: | 曹葆青;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 路径转移 随机游走 社交网络 随机选取 采样 转入 数据处理领域 度数 节点序列 邻居节点 拓扑信息 偏置 预设 回溯 匹配 概率 重复 记录 | ||
本发明公开了一种面向社交网络的度偏置采样方法及系统,属于大数据处理领域,包括:在一轮游走中,随机选取一个未游走过的节点开始随机游走,并确定与其度数相匹配的游走路径长度阈值;从当前游走节点u的邻居节点中随机选取一个节点v,若d(v)<d(u),则以概率p(与d(v)/d(u)反相关)拒绝接受路径转移,使得游走路径转移至节点v后回溯至节点u,否则,接受路径转移;若游走路径的长度达到长度阈值,则记录节点序列,并转入对下一个未游走节点的随机游走;重复上述步骤直至所有节点在当前轮次都被游走过;若达到预设的游走次数,则采样结束,否则,设置所有节点为未游走过的节点,转入下一轮随机游走。本发明能够高效且精确地提取社交网络的拓扑信息。
技术领域
本发明属于大数据处理领域,更具体地,涉及一种面向社交网络的度偏置采样方法及系统。
背景技术
随着社交媒体的飞速发展,在线社交网络成为了人们赖以生存的第二世界,初步统计,每个网民平均加入了8个在线社交媒体。主流的社交网络都用着这庞大的用户群体,有数据显示,成立于2004年的Facebook的月活跃度用户数曾一度达到20亿,Twitter的月活跃度用户数保持在3.2亿左右,国内的社交工具QQ目前的月活跃度用户数达到了8.61亿,崛起于2011年的新兴社交工具微信的月活跃度用户数超过了9.6亿,新浪微博的月活跃度用户数则达到了3.4亿。毫无疑问,社交网络已经成为了连接网络信息空间和人类物理世界不必可少的桥梁,因此,社交网络分析成为了无论工业界还是学术界的研究热点。
在实际分析中常采用图网络表示社交网络,由于社交网络往往具有复杂、大规模、无标度、高度非线性等特点,如何高效的表征网络数据是对社交网络分析面临的首要挑战。网络表示学习(Network Representation Learning)方法是就是一种重要的表征网络数据的方法,它旨在将网络中的节点表示成低维、实值、稠密的向量形式,使得得到的向量形式可以在向量空间中具有表示以及推理的能力,同时可以轻松方便的作为机器学习模型的输入,进而可将得到的向量表示运用到社交网络中常见的应用中,如可视化任务、节点分类任务、链接预测以及社区发现等任务,还可以作为社交边信息应用到推荐系统等其他常见任务中。节点采样是网络表示学习方法的基础。
随机游走作为一种经典的复杂网络采样算法,指给定一个复杂网络和一个起始节点,随机地选择并转移到一个邻居结点,然后再以所选邻居节点为出发点,重复以上过程。随机游走因具备高度灵活性并且只依赖于网络局部信息的特征,已经被广泛应用至面向社交网络的网络表示学习之中。由于真实的社交网络具有无标度性,而随机游走进行节点采样时,采用全局一致的策略来采集网络的拓扑信息,这导致生成的节点序列存在大量的冗余信息,也无法精确地保留原始网络的拓扑结构,从而极大地影响了网络表示学习方法的效果和效率,无法高效且精确地提取社交网络的拓扑信息。
发明内容
针对现有技术的缺陷和改进需求,本发明提供了一种面向社交网络的度偏置采样方法及系统,其目的在于,高效且精确地提取社交网络的拓扑信息。
为实现上述目的,按照本发明的第一方面,提供了一种面向社交网络的度偏置采样方法,包括:
(1)从复杂网络中随机选取一个未游走过的节点s作为起点,开始进行随机游走,并确定游走路径的长度阈值Lth(s),长度阈值Lth(s)与节点s的度数L(s)相匹配;
(2)从当前的游走节点u的所有邻居节点中随机选取一个节点v,若节点v的度数d(v)小于节点u的度数d(u),则节点v以概率p拒绝接受路径转移,以使得游走路径转移至节点v后回溯至节点u;否则,节点v直接接受路径转移,以使得游走路径转移至节点v;概率p与d(v)/d(u)反相关;
(3)若游走路径当前的长度L≥Lth(s),则记录该游走路径的节点序列,并转入步骤(4);否则,转入步骤(2);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910866302.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息推送的方法及装置
- 下一篇:基于特征工程的相似移动应用计算方法及装置