[发明专利]一种图数据的分区方法、装置以及设备有效
申请号: | 202010057861.9 | 申请日: | 2020-01-16 |
公开(公告)号: | CN111241353B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 唐德荣 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/906 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 王戈 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 分区 方法 装置 以及 设备 | ||
本说明书实施例公开了一种图数据的分区方法、装置以及设备。所述方法包括:获取待处理的图数据;对所述待处理的图数据的节点数据进行打散处理,获得所述待处理的图数据的第一分区结果;基于所述第一分区结果,对所述第一分区结果中对应的各个节点进行聚类分析,获得所述待处理的图数据的第二分区结果,以使所述第二分区结果中相邻连通图的顶点数据和/或边数据存储在同一个分区中,所述第二分区结果为所述待处理的图数据的最终分区结果。采用本说明书实施例提供的图数据的分区方法,能够实现图数据的存储负载均匀,避免热点问题,且能够提升图数据的计算效率。
技术领域
本说明书涉及计算机技术领域,尤其涉及一种图数据的分区方法、装置以及设备。
背景技术
图在生活中无处不在,社交媒体、科学中分子结构关系、电商平台的广告推荐、网页信息等等,都能够以图数据的形式进行表达。图能够将人、产品、想法、事实、兴趣爱好之间的关系全部转换存储。各种场景下的信息都能转成图来表示,同时我们可以利用图来进行数据挖掘和机器学习,比如识别出有影响力的人和信息、社区发现、寻找产品和广告的投放用户、给有依赖关系的复杂数据构建模型、分类标签等等这些都可以使用图来完成。随着互联网的飞速发展,会产生海量的图数据,图分布式存储分区算法(图分区)应运而生,以满足海量图数据的分区。
现有技术中,边分割(Edge-Cut)和点分割(Vertex-Cut)为重要的图分区方法。边分割能够节省存储空间,但是会产生额外的边数据,需要跨机器通信传输数据,内网通信流量大。点分割具有较好的性能,但是会产生额外的节点数据,冗余较大,会增加存储开销。
因此,需要一种更为便捷、高效的图数据的分区方法。
发明内容
本说明书实施例提供一种图数据的分区方法、装置以及设备,用于解决以下技术问题:边分割会产生额外的边数据,内网通信流量大和/或边分割会产生额外的节点数据,冗余较大,会增加存储开销。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种图数据的分区方法,包括:
获取待处理的图数据;
对所述待处理的图数据的节点数据进行打散处理,获得所述待处理的图数据的第一分区结果;
基于所述第一分区结果,对所述第一分区结果中对应的各个节点进行聚类分析,获得所述待处理的图数据的第二分区结果,以使所述第二分区结果中相邻连通图的顶点数据和/或边数据存储在同一个分区中,所述第二分区结果为所述待处理的图数据的最终分区结果。
本说明书实施例提供的一种图数据的分区装置,包括:
获取模块,获取待处理的图数据;
第一分区模块,对所述待处理的图数据的节点数据进行打散处理,获得所述待处理的图数据的第一分区结果;
第二分区模块,基于所述第一分区结果,对所述第一分区结果中对应的各个节点进行聚类分析,获得所述待处理的图数据的第二分区结果,以使所述第二分区结果中相邻连通图的顶点数据和/或边数据存储在同一个分区中,所述第二分区结果为所述待处理的图数据的最终分区结果。
本说明书实施例还提供一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待处理的图数据;
对所述待处理的图数据的节点数据进行打散处理,获得所述待处理的图数据的第一分区结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010057861.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置