[发明专利]一种基于作业类型识别的自适应混合云计算框架生成方法有效

专利信息
申请号: 201910110312.0 申请日: 2019-02-11
公开(公告)号: CN109933306B 公开(公告)日: 2020-07-14
发明(设计)人: 史玉良;张坤 申请(专利权)人: 山东大学
主分类号: G06F8/20 分类号: G06F8/20;G06F9/50
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 杨哲
地址: 250061 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 作业 类型 识别 自适应 混合 计算 框架 生成 方法
【说明书】:

发明公开了一种基于作业类型识别的自适应混合云计算框架生成方法,在底层大数据集群的基础上,通过集群资源的统一调度实现对计算框架的资源支撑,接收用户提交根据统一编程模型的编写的作业,识别作业类型并自动判断适用的计算框架,实现不同应用场景下批量数据、流数据等的统一处理,有效实现更好的通用性并更好的提升性能。

技术领域

本公开属于分布式计算的技术领域,涉及一种混合计算框架生成、数据处理方法、装置及混合计算框架,尤其涉及一种基于作业类型识别的自适应混合计算框架生成方法及装置、一种数据处理方法及装置以及一种基于作业类型识别的自适应混合计算框架。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。

随着信息技术的不断发展,数据处理面对的数据量快速增长,需挖掘数据种类越来越多,包括结构化数据、文本数据、图形数据、数据流等,离线处理、在线计算、图算法、迭代式算法。目前大数据处理基本可分为两个类型:

(1)复杂的批量数据计算处理,通常时间跨度在数十分钟到数小时之间;

(2)基于实时数据流的数据处理,通常的时间跨度在数百毫秒到数秒之间。

两种处理类型目前都已有相对成熟的架构来处理,如利用MapReduce来进行批量数据处理,利用Storm来进行实时数据流的处理。

根据处理类型,当前大数据处理框架一般分为批处理计算框架、流处理计算框架和混合处理计算框架三类,批处理计算框架以Hadoop等为代表,特点是时间和资源要求低;流处理计算框架以Storm、Samza等为代表,特点是实时性高但吞吐量低;混合处理计算框架包括Spark、Flink,能同时处理批处理和流处理工作负载,但各有侧重,Spark运行原理建立在内存批处理之上,本质上属于批处理计算框架,其流处理SparkStreaming属于微批处理,而Flink是可处理批处理任务的流处理框架,本质上属于流处理计算框架,将批处理当做具备有限边界的数据流处理。

设计理念的不同使得每种计算框架都有其适用的最佳应用场景,如Hadoop适用于进行大规模静态数据的批量计算处理场景,但在面向低延迟和具有复杂数据关系(如多表关联查询)等问题时有很大的不适应性;Spark适用于迭代应用及交互式应用,在机器学习、交互式查询等应用场景具有优势;Storm适用于动态处理不断流入的小数据块,如实时日志处理、实时统计等场景,不同计算框架之间难以相互取代。大数据应用复杂多样,可能会同时包含不同特征的数据和计算,在这种情况下单一的计算框架多半难以满足整个应用的需求,往往需要多种计算框架处理不同的场景。考虑到资源维护成本等一系列问题,为不同的计算框架搭建不同的集群显然是不现实的,因此需要考虑集群中不同计算框架的混合使用。

当前已在混合计算框架方面进行了一定的研究,如研究集群资源的统一调度机制等,提升集群资源利用率。但对于作业层面的统一调度的研究较少,用户需要根据经验判断应用场景适用的计算框架并提交相应的应用程序,由于不同计算架构的编程模型、业务逻辑等均有很大差异,用户切换不同的分布式处理框架的成本很高,无法实现根据作业的混合计算架构的自适应匹配及运行。

发明内容

针对现有技术中存在的不足,本公开的一个或多个实施例提供了一种混合计算框架生成、数据处理方法、装置及混合计算框架,在底层大数据集群的基础上,通过集群资源的统一调度实现对计算框架的资源支撑,在此基础上,根据用户提交的根据统一编程模型的编写的作业,识别作业类型并自动判断适用的计算框架,实现不同应用场景下批量数据、流数据等的统一处理,以实现更好的通用性并更好的提升性能。

根据本公开的一个或多个实施例的一个方面,提供一种基于作业类型识别的自适应混合计算框架生成方法。

一种基于作业类型识别的自适应混合计算框架生成方法,该方法包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910110312.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top