[发明专利]一种云计算平台下的数据同步更新方法有效

专利信息
申请号: 201610608344.X 申请日: 2016-07-28
公开(公告)号: CN106156359B 公开(公告)日: 2019-05-21
发明(设计)人: 张敬华;程映忠;王松 申请(专利权)人: 广东奥飞数据科技股份有限公司
主分类号: G06F16/27 分类号: G06F16/27;H04L29/08
代理公司: 东莞市神州众达专利商标事务所(普通合伙) 44251 代理人: 陈世洪
地址: 511458 广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出了一种云计算平台下的数据同步更新方法,包括:1.构建基于Hadoop分布式文件系统的云数据备份系统,所述系统从物理上分为客户端、备份服务器和Hadoop分布式文件系统集群;2.客户端中保存着为本机提供服务的备份服务器的信息,当需要备份或恢复时向备份服务器发出相应请求;3.备份服务器接收到客户客户端的请求,进行文件的备份和恢复。本发明提出的所述方法提高了备份文件、更新文件的效率。
搜索关键词: 一种 计算 平台 数据 同步 更新 方法
【主权项】:
1.一种云计算平台下的数据同步更新方法,包括:(1)构建基于Hadoop分布式文件系统的云数据备份系统,所述系统从物理上分为客户端、备份服务器和Hadoop分布式文件系统集群;(2)客户端中保存着为本机提供服务的备份服务器的信息,当需要备份或恢复时向备份服务器发出相应请求;(3)备份服务器接收到客户客户端的请求,进行文件的备份和恢复;其中,所述客户端是企业中众多需要数据备份/恢复服务的计算机节点,按照地域、系统类别等分成若干个群,当需要进行数据备份或者恢复时,他们向负责本群的备份服务器提出请求,得到许可后进行文件的备份和恢复操作;客户端用于实现数据备份恢复,包括文件打包、压缩策略,数据的备份和恢复;所述备份服务器是客户端和Hadoop分布式文件系统集群间数据备份恢复的桥梁,由多个高性能、大存储量服务器构成,每个服务器负责一个客户端群,他们接受客户端的备份恢复请求,缓存客户端的备份数据,根据备份数据的不同情况,分别对他们进行合并、分割、压缩后上传到Hadoop分布式文件系统集群进行备份,同时保存客户端备份文件的映像表,当客户端提出恢复请求时,从Hadoop分布式文件系统集群中读取备份文件,按照文件映像表发送给客户端;所述Hadoop分布式文件系统集群由安装了Hadoop分布式文件系统软件的计算机组成,在Hadoop分布式文件系统软件的架构下,通过配置向多个备份服务器提供上传、下载服务,实现系统的核心功能;Hadoop分布式文件系统集群采用主/从结构,由一个名字节点Namenode和一定数量的数据节点Datanodes组成,Namenode作为为中心服务器负责管理文件系统的名字空间namespace以及客户对文件的访问;Namenode执行文件系统的打开、关闭、重命名文件或目录这些名字空间操作;也负责确定数据块到特定Datanode节点的映射,Namenode由企业云中具有较高性能的服务器配置而成,以实现高效的元数据管理,避免性能瓶颈,DataNode用于存储数据,由企业内部大量廉价计算机配置而成,并且可以根据备份数据的规模进行动态扩展,备份时文件被分成一个或多个数据块,这些块存储在一组Datanode上;Datanode负责对文件系统客户端的读写请求进行处理,并在Namenode的统一调度下进行数据块的创建、删除和复制等操作;其中,当监测到客户端的文件发生改变时,使用以下方式同步更新Hadoop分布式文件系统集群上相应的文件:(1)当监测到客户端的文件CFold变更为文件CFnew时,将发生改变的文件ID发送给Hadoop分布式文件系统集群;(2)根据客户端发来的文件ID,Hadoop分布式文件系统集群将CFold对应的SFold划分为大小为B的块,SFold[(i‑1)B,iB‑1],表示文件从偏移地址(i‑1)B到iB‑1的内容,其中,i的取值为[1,2,3,……,N],N是文件SFold划分的块数;然后计算每个块Bi的两个哈希值:qi=hq(Bi)和ri=hm(Bi),其中,hq(Bi)表示对块Bi进行alder‑32校验计算,hm(Bi)表示对块Bi进行MD5校验计算,然后将两个校验值发送给客户端;(3)客户端接收Hadoop分布式文件系统集群发来的每个块的两个哈希值(qi,ri),建立哈希表;(4)客户端遍历文件CFnew,从偏移地址j=0开始,重复执行以下步骤4.1‑4.4:(4.1)计算hq(CFnew[j,j+B‑1]);(4.2)从哈希表中查找是否具有匹配的哈希值;(4.3)如果找到匹配哈希值,计算hm(CFnew[j,j+B‑1]),如果hm也匹配,则发送该块的偏移地址j和该块的大小信息给分布式文件系统集群,并对j进行加B操作;(4.4)如果没有找到匹配哈希值,或者hm不匹配,则传输CFnew[j]给Hadoop分布式文件系统集群,CFnew[j]表示文件CFnew在偏移地址j处的内容,j=j+1;(5)Hadoop分布式文件系统集群根据客户端传送的内容和SFold构建出与CFnew对应的文件SFnew
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东奥飞数据科技股份有限公司,未经广东奥飞数据科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610608344.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top