[发明专利]一种数据处理方法和系统有效
申请号: | 202110835177.3 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113434737B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 唐坤;马文金 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/27;G06F16/2455;G06F16/23 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 袁春晓 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 系统 | ||
1.一种数据处理方法,其包括:
获取图数据;其中,所述图数据包括节点与边;所述图数据用于表示资金的流转信息、人员的流转信息、货物的流转信息或车辆的流转信息中的至少一个;
确定所述图数据中节点的入边和/或出边的数量,将出边数量大于第一预设阈值的节点、入边数量大于第一预设值、或出边数量和入边数量均大于第一预设阈值的节点确定为第一类节点;
将每个第一类节点分别进行拆分,获得入边数量和出边数量均不大于第二预设阈值的若干子节点,进而得到更新后的图数据;
将更新后的图数据进行划分得到若干个分组;其中,分组包含一个或多个节点及其边、和/或一个或多个子节点及其边;
对获得的若干分组分布式存储在多台设备上。
2.如权利要求1所述的方法,边具有时间信息;所述将第一类节点进行拆分,获得入边数量和出边数量均不大于第二预设阈值的若干子节点,包括:
当第一类节点的出边数量大于第一预设阈值且入边数量不大于第一预设阈值时,将其出边按照时序划分给多个子节点,并将该第一类节点的入边对应划分到与其具有预设关联关系的出边所在的子节点中;
当第一类节点的入边数量大于第一预设阈值且出边数量不大于第一预设阈值时,将其入边按照时序划分给多个子节点,并将该第一类节点的出边对应划分到与其具有预设关联关系的入边所在的子节点中;
当第一类节点的入边数量和出边数量均大于第一预设阈值时,将数量更多的一类边按照时序划分给多个子节点,并将该第一类节点的另一类边对应划分到与其具有预设关联关系的所述一类边所在的子节点中。
3.如权利要求2所述的方法,所述预设关联关系包括时间最接近。
4.如权利要求1所述的方法,所述对获得的若干分组分布式存储在多台设备上,包括:
将包含子节点的若干分组基于预设均衡分配策略分发至所述多台设备上。
5.如权利要求4所述的方法,所述将包含子节点的若干分组基于预设均衡分配策略分发至所述多台设备上,包括:
一次向一台设备发送一个所述分组,如此将多个所述分组依次分发至所述多台设备上;如果所述分组的数量大于设备数量,则对剩余的所述分组重复执行前述分发操作,直到将所述若干分组全部分发至所述多台设备上。
6.如权利要求1所述的方法,所述图数据基于时间周期内的目标数据获得,进而通过多次执行所述方法能够将不同时间周期对应的图数据依次分布式存储在所述多台存储设备上。
7.如权利要求6所述的方法,还包括:将不同时间周期对应的所述更新后的图数据中的相同节点及其边存储于同一存储设备上。
8.如权利要求6所述的方法,当当前时间周期内的第一类节点在历史时间周期内不是第一类节点时,所述方法还包括:
将该第一类节点在历史时间周期中的边划分后分别迁移到该第一类节点的各子节点所在的存储设备上;其中,将该第一类节点在历史时间周期中的、且与该第一类节点的某子节点的边具有相同的节点以及方向的边迁移至该子节点所在的存储设备上。
9.如权利要求1所述的方法,所述图数据为数据流转图;所述数据流转图的节点间具有数据流转,节点之间的边反应数据在节点间的流转信息。
10.如权利要求9所述的方法,所述数据包括资金数据,所述节点对应于用于存储资金的账户;所述流转信息包括以下中的一种或多种:流转方向、流转场景以及流转时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110835177.3/1.html,转载请声明来源钻瓜专利网。