[发明专利]一种分布式云计算集群组海量数据备份和还原的方法无效
申请号: | 201210372575.7 | 申请日: | 2012-09-29 |
公开(公告)号: | CN102902605A | 公开(公告)日: | 2013-01-30 |
发明(设计)人: | 张华;王刚;张立勇;胡顺杰;陈峰 | 申请(专利权)人: | 山东浪潮齐鲁软件产业股份有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F17/30;H04L29/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 计算 集群 海量 数据 备份 还原 方法 | ||
技术领域
本发明涉及到云计算操作系统领域,具体的说是一种分布式云计算集群组海量数据备份和还原的方法。
背景技术
随着web2.0的诞生,IT技术的飞跃发展,人们对信息化需求越来越大,传统的结构化数据库面对日益增长的海量数据已明显力不从心。云计算开始登上IT的舞台,NoSql数据库被广泛使用,分布式文件存储已成为主角。
对于一些行业,比如卫生、电信,每天的数据增长量非常庞大,海量数据的存储问题可以使用分布式文件系统来存储,但面对庞大的数据,本地和异地的备份与还原的确让人头疼,也是很多IT企业一直研究的课题。目前市场上的备份软件大部分收费且很多是单纯的拷贝移动文件,并简单的进行管理。一旦本地出现问题,受带宽和其他因素影响,根本无法在短时期内将异地备份数据还原,无法保证系统的高可用。
因此需要一种海量数据的本地、异地备份方案来解决日益增长的数据,来保证系统的高可用性。
发明内容
本发明针对目前海量数据本地、异地处理中存在的问题,提出一种分布式云计算集群组,以解决海量数据的本地、异地备份和还原的问题。
本发明的目的时按一下方式实现的,以分布式文件系统为载体,在分布式集群之上建立集群组,在同一区域和不同区域分别部署分布式文件集群,实现海量数据本地、异地的备份和还原,内容包括:集群组分布式计算、云管理驾驶舱和海量数据异地备份与还原三部分,具体步骤如下:
1)集群组分布式计算
分散在同一区域和不同区域的集群分别对数据进行计算和抽取,并将结果进行汇总;
2)云管理驾驶舱
云计算集群组的CPU,担负着整个集群组的管理与分发,异常的处理与恢复,当云管理驾驶舱收到的是一个文件,则将文件根据不同区域保存到不同的集群组,保证每个区域至少保存一份文件;当某个区域出现异常无法保存时,管理驾驶舱记录该区域的信息以及未保存到该区域的文件,并时时监控异常区域的情况;当异常区域正常连接时,云管理驾驶舱自动从其它集群读取相关数据,将未保存到该区域的文件或数据重新保存到该区域集群中,实现数据的恢复;
当云管理驾驶舱收到的是一组数据和指令时,管理驾驶舱首先检查目前可以连接的集群,并将数据分发到各集群按照指令进行运算,并最终将结果汇总输出;
3)海量数据异地备份与还原
在不同区域部署不同的集群,保证数据在不同区域至少保存一份,实现数据的异地备份;当本地集群出现异常时,云管理驾驶舱自动访问异地集群,并保存异常相关信息,等本地集群恢复后,自动将丢失文件存入到本地集群;故障系统的还原无需切换,没有时间消耗。
本发明的有益效果是:本发明所述分布式云计算集群组,在分布式集群之上建立集群组,该集群组在同一区域和不同区域本别部署分布文件集群,通过云管理驾驶舱对各集群进行统一管理和操作,同一份文件在不同区域至少保存一份,只要有一个集群的文件存储成功,则文件保存成功,文件的存储对用户透明,部分集群异常不会影响整个系统运行,云管理驾驶舱会记录未保存成功的集群与文件,在异常集群恢复后自动从其它集群读取该文件数据保存到该集群,变通的实现海量数据异地备份或还原,大大提高系统的可用性和安全性。不同的集群组可以再次组成更高一层的集群组,由更高一层的云管理驾驶舱进行管理。
该集群以云计算为理念,充分利用现有资源,在分布式集群之上建立集群组,不受区域限制,不受宽带限制,存储和计算完全对用户透明,以变通方式实现了海量数据异地备份与还原,提高了分布式计算的效率,保证了软件系统的高可用性,同时为企业和软件使用单位节省了成本。
附图说明
附图1本发明所述集群组的宏观数据走向示意图;
附图2本发明所述集群组的微观数据走向示意图。
具体实施方式
下面结合附图1和附图2对本发明的方法作进一步详细说明。
本发明一种分布式云计算集群组海量数据备份和还原的方法,是以分布式文件系统为载体,构建对用户透明的集群组式文件存储与计算,其解决所述技术问题采用的技术方案为:该集群组由集群组分布式计算、云管理驾驶舱和海量数据异地备份与还原三部分组成,其中:
集群组分布式计算是指分散在同一区域和不同区域的集群,分别对数据进行计算和抽取,并将结果进行汇总;
云管理驾驶舱是云计算集群组的CPU,担负着整个集群组的管理与分发,异常情况的处理与恢复;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮齐鲁软件产业股份有限公司,未经山东浪潮齐鲁软件产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210372575.7/2.html,转载请声明来源钻瓜专利网。