[发明专利]一种分布式数据集的数据管理方法及相关装置在审
申请号: | 201811645982.4 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109726252A | 公开(公告)日: | 2019-05-07 |
发明(设计)人: | 张镇潮;叶春飞;钱晓雷;吴海明;刘勋堂;钱立阳 | 申请(专利权)人: | 税友软件集团股份有限公司 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/25;H04L29/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 310053 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标子集 数据同步 分布式数据 目标设备 数据管理 计算机可读存储介质 数据管理系统 管理节点 相关装置 子集数据 申请 服务器 | ||
本申请公开了一种分布式数据集的数据管理方法,包括:当接收到目标子集增加请求时,管理节点根据目标子集增加请求确定目标子集的最高节点ID;根据所述最高节点ID确定数据同步范围;根据所述数据同步范围将分布式数据集中的对应数据向目标设备进行数据同步,以便在所述目标设备中增加目标子集。通过目标子集中的最高节点ID确定了进行数据同步的范围,进而实现向目标设备进行数据同步,提高了子集数据的获取效率。本申请还公开了一种分布式数据集的数据管理系统、服务器以及计算机可读存储介质,具有以上有益效果。
技术领域
本申请涉及分布式数据集技术领域,特别涉及一种分布式数据集的数据管理方法、数据管理系统、服务器以及计算机可读存储介质。
背景技术
随着信息技术的不断发展,出现了去中心化的分布式技术。在分布式的基础上出现了基于分布式技术的数据存储技术。
在以上分布式的数据存储方案中,一般都是在同一个的组织网络中保存整个分布式数据集。并且该分布式数据集中可以按照不同的管理权限或者数据分布进行分类。例如,该分布式数据集的数据来源是A公司、B社区以及C医院,以上所有组织的数据均通过该总的分布式数据集进行管理,以及数据保存。但是,当任意一个组织需要获取对应的目标数据子集时,要不同步全部整套分布式数据集的数据,要不重新从源头收集其想要的数据。但是,全部拷贝数据不仅需要更多的存储资源,并且数据获取的速度也十分缓慢,效率极低。而重新获取数据,需要从每个数据源头重新进行数据同步,也面临数据获取效率较低的问题。
因此,如何效率更快的获取目标子集的数据是本领域技术人员关注的重点问题。
发明内容
本申请的目的是提供一种分布式数据集的数据管理方法、数据管理系统、服务器以及计算机可读存储介质,通过目标子集中的最高节点ID确定了进行数据同步的范围,进而实现向目标设备进行数据同步,提高了子集数据的获取效率。
为解决上述技术问题,本申请提供一种分布式数据集的数据管理方法,包括:
当接收到目标子集增加请求时,管理节点根据目标子集增加请求确定目标子集的最高节点ID;
根据所述最高节点ID确定数据同步范围;
根据所述数据同步范围将分布式数据集中的对应数据向目标设备进行数据同步,以便在所述目标设备中增加目标子集。
可选的,根据所述最高节点ID确定数据同步范围,包括:
根据所述最高节点ID与从属节点ID之间编码关系在所有节点中进行查找,得到多个从属节点;
将所述多个从属节点加入到所述数据同步范围。
可选的,根据所述最高节点ID确定数据同步范围,包括:
根据所述最高节点ID在节点从属关系链表中进行查找,得到多个从属节点;
将所述多个从属节点加入到所述数据同步范围。
可选的,根据所述最高节点ID确定数据同步范围,包括:
根据所述最高节点ID在节点关系图中确定最高节点对应的多个从属节点;
将所述多个从属节点加入到所述数据同步范围。
可选的,还包括:
当接收到目标子集删除请求时,管理节点根据所述目标子集删除请求确定对应的数据同步范围;
从数据同步列表中删除所述数据同步范围。
本申请还提供一种分布式数据集的数据管理系统,包括:
最高节点确定模块,用于当接收到目标子集增加请求时,根据目标子集增加请求确定目标子集的最高节点ID;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于税友软件集团股份有限公司,未经税友软件集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811645982.4/2.html,转载请声明来源钻瓜专利网。