[发明专利]一种用于处理地理分布式数据的跨集群计算系统有效

专利信息
申请号: 201910360062.6 申请日: 2019-04-30
公开(公告)号: CN110308984B 公开(公告)日: 2022-01-07
发明(设计)人: 沃天宇;李振平;杨任宇;罗彦林 申请(专利权)人: 北京航空航天大学
主分类号: G06F9/50 分类号: G06F9/50
代理公司: 北京中创阳光知识产权代理有限责任公司 11003 代理人: 尹振启
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 处理 地理 分布式 数据 集群 计算 系统
【说明书】:

一种用于处理地理分布式数据的跨集群计算的系统,包括有三层的集群管理框架,包括全局主节点‑‑集群主节点‑‑从节点,全局主节点负责管理所有的集群主节点,每个集群主节点则负责管理集群内部的从节点,使用应用提交客户端向全局主节点提交应用程序时,全局主节点会选择一个其管理的集群主节启动全局驱动器,所述全局驱动器启动成功后向全局主节点注册全局应用描述,全局主节点根据描述在各个集群主节点启动集群驱动器,集群驱动器启动成功后,向集群主节点注册集群应用描述,集群主节点再根据描述在各个内部从节点启动执行器,全部启动成功后,由全局驱动器开始任务分发和数据交换等来完成一个应用的执行。

技术领域

发明涉及一种跨集群计算方系统,尤其涉及用于处理地理分布式数据的跨集群计算系统。

背景技术

地理分布式数据是指那些由不同地理位置的集群所生成的数据,这一类型数据往往具有类似的格式,可以统一处理。地理分布式数据随集群提供的服务持续生成,无论是累积的历史数据量,还是新数据的生成速度都非常大。

地理分布式数据的产生通常有两个原因:1,许多组织在多个国家有业务,并在全球运营多个数据中心,如大型跨国公司为提供最佳的服务体验,往往在多个国家和区域就近部署服务集群。即使在一个国家,数据也可能分布在不同的系统和地点,如同一个国家的某个银行的多个支行;2,一个组织可能倾向于使用多个公有或私有云来增加可靠性,安全性和处理能力。

地理分布式数据的处理有多个场景。例如,一个生物信息学应用需要分析存储在不同实验室和国家的基因组数据来追踪流行疾病的源头,一个气候科学应用需要分析全球各个国家气象站存储的气象数据来模拟地理气候演变,一个服务器监视应用需要分析全球各个区域服务器的日志数据来提供运行状态报告。还有更多类似的应用案例,像传感器网络,股票交易,社交网络应用,分布式摄像机的视频流等。这一类处理应用有相同的特点:1,数据是地理分布的,且数据量巨大,移动会产生大量的广域网带宽成本;2,因为安全、隐私、区域政策、数据敏感等因素,限制原始数据跨国或跨区域的移动;3,大多数的分析任务(Task)都只需要很小的一部分原始数据来生成最后的输出。

现有技术对地理分布式数据的处理有三种方法:方法1,把分布在各个集群上的数据全部拉取到一个集群上,再使用成熟的大数据处理框架,如开源的大数据项目Hadoop、Spark来对所有的数据进行处理,然而在跨国家或跨区域移动原始数据往往是法律禁止的,即使这些数据允许移动,通过广域网汇总所有集群的数据会带来巨大的带宽成本,即使带宽成本在能承受的范围内,这些数据本身可能是动态持续快速产生的,则可能需要多次移动数据,用此种方法只适用于数据大小固定、数据量不大也不敏感的数据处理。

方法2,在每个集群上搭建大数据处理框架,针对具体的业务逻辑写一个应用,将这个应用发送到各个集群上去运行,再将数据处理的结果拉取到一个集群,再写另一个应用处理这些汇总的结果数据来得到最后的输出。此种方法的问题在于,当业务逻辑复杂时,可能需要编写多个应用,并配合额外的调度系统来调度执行这些应用。例如,要获取一个服务的用户总数,需要先在各个集群上统计此地区的用户数,再把这些数据汇总到一个集群再计算总和。用户总数就是一个全局量,每个全局量的获取都需要2个应用的执行。这个方案只适用于简单的业务逻辑编写。

方法3,通过把多个集群的计算节点在网络层通过隧道协议连通,将所有集群的所有计算节点连成一个整体,在这个整体上部署成熟的大数据框架,如分布式文件系统(HDFS),分布式计算框架(MapReduce、Spark),分布式资源调度系统(Yarn)等。然而多个集群并不能完全视为一个巨大的集群,集群内的网络为局域网,高速低延迟且各向同性,集群间的网络为广域网,低速高延迟且各向异性。当前成熟的大数据框架本身是为单集群设计的,并没有为这种特殊的网络性质做优化,在具体的数据处理中也不够高效。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910360062.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top