[发明专利]社交网络中用户间连接关系特征的获取方法及系统有效
申请号: | 201910233454.6 | 申请日: | 2019-03-26 |
公开(公告)号: | CN110032605B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 王芳;冯丹;张玲玲 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 曹葆青;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络 用户 连接 关系 特征 获取 方法 系统 | ||
本发明公开了一种社交网络中用户间连接关系特征的获取方法及系统,属于大数据处理领域,包括:根据待处理的社交网络中用户间的关系建立流式图;建立两个用于存储边的数据结构,分别称为基础蓄水池和渐增蓄水池;基础蓄水池可存储的边数固定为c,渐增蓄水池可存储的边数动态增加;遍历流式图,使得第1~c条边以1的概率进入基础蓄水池,第c+1~N条边进入以和的概率进入基础蓄水池和渐增蓄水池,基础蓄水池中的边在发生替换时等概率被替换出,渐增蓄水池中的边不会被替换出;遍历基础蓄水池与渐增蓄水池中边集的并集以得到样本边集中每一个顶点的度,从而得到社交网络中用户之间的连接关系特征。本发明能够获取关系网络中实体间的连接关系特征。
技术领域
本发明属于大数据处理领域,更具体地,涉及一种关系网络中实体间连接关系特征的获取方法及系统。
背景技术
随着大数据时代的到来,人与人之间、物与物之间、人与物之间都存在复杂的关系,由此形成了各种复杂的关系网络。例如,构成物质的分子与分子之间的关系形成的结构图,用户与用户之间的关系形成的社交网络,计算机与计算机之间的通信关系形成的计算机网络等,都属于关系网络。
图作为一种重要的数据结构,可以很方便地用于表达关系网络中实体(人、物等)与实体之间的连接关系。随着应用中数据量的增大,实际的应用中通常采用流式图这种结构来存储和处理这些数据。流式图的边存储在计算机中,而每条边是由对应的关系网络中两个有连接关系的实体(顶点)组成。然而,流式图中的边并不是孤立的,这些边之间有连接关系。例如在社交网络图中,用户a和用户b互为好友关系,即(a,b)是流式图中的一条边;同时,用户a和用户c互为好友关系,即(a,c)是流式图中的另外一条边;边(a,b)和(a,c)共有一个共同顶点a,即这两条边是连接的。根据关系网络建立流式图,并挖掘流式图中的边的连接关系特征可以获取到关系网络中实体间的连接关系特征,从而为相关的应用提供更为有效的信息。例如,在社交网络中,流式图中边的链接类特征可用于判断该社交网络是否能够用于某种产品的推广或者规划相关的广告费用。具体来说,如果该流式图中边之间的连接关系很紧密,说明在该社交网络中用户之间的连接关系十分紧密,那么该在该社交网络中发布广告,受众群会比较多,会带来较好的广告收益。反之,如果某个社交网络的用户之间的连接关系比较稀疏,在该社交网络上投放广告,可能不能够达到预期的广告效益。
由于关系网络结构很复杂,根据关系网络所建立的流式图中边数据量都比较大,基于整个流式图进行处理会给计算资源和存储资源带来挑战。针对这个问题,现有的方法在获取到关系网络所对应的流式图之后,常采用基于蓄水池的单次抽样方法来获取对应的流式图的特征,在该方法中,每条边只被处理一次,并且抽样得到的边集存储于一个称为蓄水池的数据结构中。由于该方法没有考虑边集的具体连接关系,抽样得到的边往往是孤立边,因此无法获取到具有连接关系的样本边集。此外,由于该方法中蓄水池的容量固定,已获取到的具有连接关系的样本有可能在之后被没有连接关系的样本替换掉。因此,现有基于流式图处理关系网络的方法,由于采用基于蓄水池的单次抽样方法处理流式图,无法获取到关系网络中实体间的连接关系特征。
发明内容
针对现有技术的缺陷和改进需求,本发明提供了一种关系网络中实体间连接关系特征的获取方法及系统,其目的在于,获取关系网络中实体间的连接关系特征。
为实现上述目的,按照本发明的第一方面,提供了一种关系网络中实体间连接关系特征的获取方法,包括:
根据待处理的关系网络中实体与实体之间的关系建立流式图;
建立两个用于存储流式图的边的数据结构,分别称为基础蓄水池和渐增蓄水池;基础蓄水池可存储的边数固定为c,渐增蓄水池可存储的边数动态增加;
遍历流式图,使得第1~c条边以1的概率进入基础蓄水池,第c+1~N条边进入以和的概率进入基础蓄水池和渐增蓄水池,已经进入基础蓄水池的边在基础蓄水池达到最大存储容量时以相等的概率被新进入的边替换出,并且已经进入渐增蓄水池的边不会被替换出;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910233454.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据存储装置、转译装置及数据库访问方法
- 下一篇:一种样本聚类方法及装置