[发明专利]一种图数据的分区方法、装置以及设备有效

专利信息
申请号: 202010057861.9 申请日: 2020-01-16
公开(公告)号: CN111241353B 公开(公告)日: 2023-08-22
发明(设计)人: 唐德荣 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06F16/901 分类号: G06F16/901;G06F16/906
代理公司: 北京晋德允升知识产权代理有限公司 11623 代理人: 王戈
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 分区 方法 装置 以及 设备
【说明书】:

本说明书实施例公开了一种图数据的分区方法、装置以及设备。所述方法包括:获取待处理的图数据;对所述待处理的图数据的节点数据进行打散处理,获得所述待处理的图数据的第一分区结果;基于所述第一分区结果,对所述第一分区结果中对应的各个节点进行聚类分析,获得所述待处理的图数据的第二分区结果,以使所述第二分区结果中相邻连通图的顶点数据和/或边数据存储在同一个分区中,所述第二分区结果为所述待处理的图数据的最终分区结果。采用本说明书实施例提供的图数据的分区方法,能够实现图数据的存储负载均匀,避免热点问题,且能够提升图数据的计算效率。

技术领域

本说明书涉及计算机技术领域,尤其涉及一种图数据的分区方法、装置以及设备。

背景技术

图在生活中无处不在,社交媒体、科学中分子结构关系、电商平台的广告推荐、网页信息等等,都能够以图数据的形式进行表达。图能够将人、产品、想法、事实、兴趣爱好之间的关系全部转换存储。各种场景下的信息都能转成图来表示,同时我们可以利用图来进行数据挖掘和机器学习,比如识别出有影响力的人和信息、社区发现、寻找产品和广告的投放用户、给有依赖关系的复杂数据构建模型、分类标签等等这些都可以使用图来完成。随着互联网的飞速发展,会产生海量的图数据,图分布式存储分区算法(图分区)应运而生,以满足海量图数据的分区。

现有技术中,边分割(Edge-Cut)和点分割(Vertex-Cut)为重要的图分区方法。边分割能够节省存储空间,但是会产生额外的边数据,需要跨机器通信传输数据,内网通信流量大。点分割具有较好的性能,但是会产生额外的节点数据,冗余较大,会增加存储开销。

因此,需要一种更为便捷、高效的图数据的分区方法。

发明内容

本说明书实施例提供一种图数据的分区方法、装置以及设备,用于解决以下技术问题:边分割会产生额外的边数据,内网通信流量大和/或边分割会产生额外的节点数据,冗余较大,会增加存储开销。

为解决上述技术问题,本说明书实施例是这样实现的:

本说明书实施例提供的一种图数据的分区方法,包括:

获取待处理的图数据;

对所述待处理的图数据的节点数据进行打散处理,获得所述待处理的图数据的第一分区结果;

基于所述第一分区结果,对所述第一分区结果中对应的各个节点进行聚类分析,获得所述待处理的图数据的第二分区结果,以使所述第二分区结果中相邻连通图的顶点数据和/或边数据存储在同一个分区中,所述第二分区结果为所述待处理的图数据的最终分区结果。

本说明书实施例提供的一种图数据的分区装置,包括:

获取模块,获取待处理的图数据;

第一分区模块,对所述待处理的图数据的节点数据进行打散处理,获得所述待处理的图数据的第一分区结果;

第二分区模块,基于所述第一分区结果,对所述第一分区结果中对应的各个节点进行聚类分析,获得所述待处理的图数据的第二分区结果,以使所述第二分区结果中相邻连通图的顶点数据和/或边数据存储在同一个分区中,所述第二分区结果为所述待处理的图数据的最终分区结果。

本说明书实施例还提供一种电子设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

获取待处理的图数据;

对所述待处理的图数据的节点数据进行打散处理,获得所述待处理的图数据的第一分区结果;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010057861.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top