[发明专利]面向大数据处理的分布式调度系统、方法及存储介质在审

专利信息
申请号: 202011069582.0 申请日: 2020-09-30
公开(公告)号: CN112162841A 公开(公告)日: 2021-01-01
发明(设计)人: 黄立;蔡春茂;段朋 申请(专利权)人: 重庆长安汽车股份有限公司
主分类号: G06F9/48 分类号: G06F9/48;G06F9/50;G06F9/54;G06F16/2455;G06F16/27;G06F16/28
代理公司: 重庆华科专利事务所 50123 代理人: 谭小琴
地址: 400023 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 数据处理 分布式 调度 系统 方法 存储 介质
【说明书】:

本发明公开了一种面向大数据处理的分布式调度系统、方法及存储介质,包括调度中心模块,用于负责工作流的依赖配置和作业开发;领导者模块,作为集群中的任务流切分和分配节点,根据依赖关系切分调度中心配置的工作流,将切分出来的具体任务节点发送给追随者节点;追随者模块,用来执行由领导者模块分配的具体计算任务,提交任务结果,保存任务执行日志;协调者模块,用于定时从数据库中取出需要执行的任务,并根据当前所有领导者模块的负载情况,采用Round‑Robin算法进行领导者模块的负载均衡;任务队列模块和元数据模块。本发明考虑到了任务上的依赖,避免了因上游任务的执行时间超时或空跑,导致下游任务出现空跑的现象,有利于整个数据流转。

技术领域

本发明属于大数据计算任务调度技术领域,具体涉及一种面向大数据处理的分布式调度系统、方法及存储介质。

背景技术

随着数据技术的飞速发展,现代企业开始从IT时代走向DT时代,无论选择公有云或自建数据中心,大数据平台已经成为现代企业的基础设施。大数据平台由最开始的单执行引擎MapReduce逐步迭代到MapReduce,Spark,Flink等多执行引擎时代。现在企业在挖掘数据价值的过程中,会产生成千上万的数据计算任务,如何对这些任务进行编排调度,构建错综复杂的计算任务依赖网显得尤为重要。

专利文献CN107506381A公开的一种大数据分布式调度分析方法、系统装置及存储介质:描述了一种自建的大数据分布式调度与分析系统,其核心功能是实现了对大数据处理技术过程的封装,并自带部分的调度功能,但是并未提出应对大数据场景下错综复杂任务流依赖和编排的方法,并且整个系统存在单点故障,并未考虑高可用容错策略,故会面临如下问题:

(1)任务分发的方式上未考虑到任务上的依赖。一旦上游任务的执行时间超时或空跑,下游任务极有可能会出现空跑现象,不利于整个数据流转过程,加重开发人员的负担。

(2)提交或执行计算任务的服务器存在单点故障,一旦宕机之后,计算任务不会触发,影响计算逻辑。

因此,有必要开发一种面向大数据处理的分布式调度系统、方法及存储介质。

发明内容

为解决以上问题,本发明提供一种面向大数据处理的分布式调度系统、方法及存储介质。

第一方面,本发明所述的一种面向大数据处理的分布式调度系统,包括:

调度中心模块,用于负责工作流的依赖配置和作业开发,通过API接口将配置完成的工作流持久化到关系型数据库的待执行工作流表中;

领导者模块,作为集群中的任务流切分和分配节点,根据依赖关系切分调度中心配置的工作流,将切分出来的具体任务节点发送给追随者节点;

追随者模块,又称执行器,用来执行由领导者模块分配的具体计算任务,提交任务结果,保存任务执行日志;

协调者模块,用于定时从数据库中取出需要执行的任务,并根据当前所有领导者模块的负载情况,采用Round-Robin算法进行领导者模块的负载均衡;

任务队列模块,为一个消息队列,包含工作流topic、任务topic和任务结果topic,用于实现工作流之间的任务依赖;

元数据模块,包括两种数据库,分别为关系型数据库和分布式内存数据库,所述关系型数据库用于持久化存储工作流的执行记录;所述分布式内存数据库用于把工作流相关元数据从关系型数据库中取出,加载到内存中。

第二方面,本发明所述的面向大数据处理的分布式调度方法,采用如本发明所述的面向大数据处理的分布式调度系统,其方法包括以下步骤:

接收对工作流的依赖配置和作业开发,通过API接口将配置完成的工作流持久化到关系型数据库的待执行工作流表中;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆长安汽车股份有限公司,未经重庆长安汽车股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011069582.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top