[发明专利]一种云计算平台下的数据同步更新方法有效
申请号: | 201610608344.X | 申请日: | 2016-07-28 |
公开(公告)号: | CN106156359B | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 张敬华;程映忠;王松 | 申请(专利权)人: | 广东奥飞数据科技股份有限公司 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;H04L29/08 |
代理公司: | 东莞市神州众达专利商标事务所(普通合伙) 44251 | 代理人: | 陈世洪 |
地址: | 511458 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种云计算平台下的数据同步更新方法,包括:1.构建基于Hadoop分布式文件系统的云数据备份系统,所述系统从物理上分为客户端、备份服务器和Hadoop分布式文件系统集群;2.客户端中保存着为本机提供服务的备份服务器的信息,当需要备份或恢复时向备份服务器发出相应请求;3.备份服务器接收到客户客户端的请求,进行文件的备份和恢复。本发明提出的所述方法提高了备份文件、更新文件的效率。 | ||
搜索关键词: | 一种 计算 平台 数据 同步 更新 方法 | ||
【主权项】:
1.一种云计算平台下的数据同步更新方法,包括:(1)构建基于Hadoop分布式文件系统的云数据备份系统,所述系统从物理上分为客户端、备份服务器和Hadoop分布式文件系统集群;(2)客户端中保存着为本机提供服务的备份服务器的信息,当需要备份或恢复时向备份服务器发出相应请求;(3)备份服务器接收到客户客户端的请求,进行文件的备份和恢复;其中,所述客户端是企业中众多需要数据备份/恢复服务的计算机节点,按照地域、系统类别等分成若干个群,当需要进行数据备份或者恢复时,他们向负责本群的备份服务器提出请求,得到许可后进行文件的备份和恢复操作;客户端用于实现数据备份恢复,包括文件打包、压缩策略,数据的备份和恢复;所述备份服务器是客户端和Hadoop分布式文件系统集群间数据备份恢复的桥梁,由多个高性能、大存储量服务器构成,每个服务器负责一个客户端群,他们接受客户端的备份恢复请求,缓存客户端的备份数据,根据备份数据的不同情况,分别对他们进行合并、分割、压缩后上传到Hadoop分布式文件系统集群进行备份,同时保存客户端备份文件的映像表,当客户端提出恢复请求时,从Hadoop分布式文件系统集群中读取备份文件,按照文件映像表发送给客户端;所述Hadoop分布式文件系统集群由安装了Hadoop分布式文件系统软件的计算机组成,在Hadoop分布式文件系统软件的架构下,通过配置向多个备份服务器提供上传、下载服务,实现系统的核心功能;Hadoop分布式文件系统集群采用主/从结构,由一个名字节点Namenode和一定数量的数据节点Datanodes组成,Namenode作为为中心服务器负责管理文件系统的名字空间namespace以及客户对文件的访问;Namenode执行文件系统的打开、关闭、重命名文件或目录这些名字空间操作;也负责确定数据块到特定Datanode节点的映射,Namenode由企业云中具有较高性能的服务器配置而成,以实现高效的元数据管理,避免性能瓶颈,DataNode用于存储数据,由企业内部大量廉价计算机配置而成,并且可以根据备份数据的规模进行动态扩展,备份时文件被分成一个或多个数据块,这些块存储在一组Datanode上;Datanode负责对文件系统客户端的读写请求进行处理,并在Namenode的统一调度下进行数据块的创建、删除和复制等操作;其中,当监测到客户端的文件发生改变时,使用以下方式同步更新Hadoop分布式文件系统集群上相应的文件:(1)当监测到客户端的文件CFold变更为文件CFnew时,将发生改变的文件ID发送给Hadoop分布式文件系统集群;(2)根据客户端发来的文件ID,Hadoop分布式文件系统集群将CFold对应的SFold划分为大小为B的块,SFold[(i‑1)B,iB‑1],表示文件从偏移地址(i‑1)B到iB‑1的内容,其中,i的取值为[1,2,3,……,N],N是文件SFold划分的块数;然后计算每个块Bi的两个哈希值:qi=hq(Bi)和ri=hm(Bi),其中,hq(Bi)表示对块Bi进行alder‑32校验计算,hm(Bi)表示对块Bi进行MD5校验计算,然后将两个校验值发送给客户端;(3)客户端接收Hadoop分布式文件系统集群发来的每个块的两个哈希值(qi,ri),建立哈希表;(4)客户端遍历文件CFnew,从偏移地址j=0开始,重复执行以下步骤4.1‑4.4:(4.1)计算hq(CFnew[j,j+B‑1]);(4.2)从哈希表中查找是否具有匹配的哈希值;(4.3)如果找到匹配哈希值,计算hm(CFnew[j,j+B‑1]),如果hm也匹配,则发送该块的偏移地址j和该块的大小信息给分布式文件系统集群,并对j进行加B操作;(4.4)如果没有找到匹配哈希值,或者hm不匹配,则传输CFnew[j]给Hadoop分布式文件系统集群,CFnew[j]表示文件CFnew在偏移地址j处的内容,j=j+1;(5)Hadoop分布式文件系统集群根据客户端传送的内容和SFold构建出与CFnew对应的文件SFnew。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东奥飞数据科技股份有限公司,未经广东奥飞数据科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610608344.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能架承载锁定组件
- 下一篇:富勒烯炔基衍生物及其制备方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置