[发明专利]基于Airflow的分布式异步任务构建、调度系统及方法有效

专利信息
申请号: 202010319540.1 申请日: 2020-04-22
公开(公告)号: CN111506412B 公开(公告)日: 2023-04-25
发明(设计)人: 李磊;谢赟;吴新野;韩欣;樊飞 申请(专利权)人: 上海德拓信息技术股份有限公司
主分类号: G06F9/48 分类号: G06F9/48;G06F9/50;G06F9/54
代理公司: 上海中外企专利代理事务所(特殊普通合伙) 31387 代理人: 孙益青
地址: 200233 上海*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 airflow 分布式 异步 任务 构建 调度 系统 方法
【说明书】:

发明公开了一种基于Airflow的分布式异步任务调度系统及其工作方法,该系统包括:API Server服务模块,Caster任务构建分发模块,Airflow调度平台和数据存储模块DB。API Server服务模块用于;Caster任务构建分发模块用于渲染任务脚本;Airflow调度平台包括任务调度模块Scheduler、任务执行单元Worker、任务执行单元管理模块Flower和分布式任务队列Celery和可视化任务调度管理界面WebServer;数据存储模块DB分别连接Caster任务构建分发模块和Airflow调度平台,用于存储构建分发模块Caster和Airflow调度平台运行过程中生成的数据日志。本发明能够有效提升系统的可用性、伸缩性,容错性,保证系统的负载均衡。

技术领域

本发明属于数据处理技术领域,具体来说涉及一种基于Airflow的分布式异步任务构建、调度系统及其方法。

背景技术

近年来,随着分布式技术的发展以及微服务化架构的逐步演进,大量的计算机应用系统逐渐有单体架构逐渐演变为分布式、微服务架构;大规模或超大规模的分布式应用已经成为主流,而随着云计算逐步向大众生活渗透,中小规模的分布式应用也在各个领域开始广泛出现。无论是互联网应用或者企业级应用,都充斥着大量的批处理任务,任务调度可以说是所有系统都必须要依赖的一个中间系统;在实际业务开发过程中,很多时候我们无可避免的需要使用一些定时任务来解决问题。通常我们会使用Crontab或SpringCron等方案来实现定时任务。然而,随着应用复杂度的升高,定时任务数量增多且任务之间产生依赖关系时,定时任务的管理配置就会非常混乱,且整合机器资源也会异常困难,现有的任务调度平台已经不能满足业务系统的需求。因此,如何设计出一种新型的分布式异步任务调度方法,以克服上述问题,是本领域技术人员需要研究的方向。

发明内容

本发明的目的是提供一种基于Airflow的分布式异步任务调度系统,能够提升系统的可用性、伸缩性,容错性,保证系统的负载均衡。

其采用的技术方案如下:

一种基于Airflow的分布式异步任务调度系统,其包括::API Server服务模块,Caster任务构建分发模块,Airflow调度平台和数据存储模块DB;

所述API Server服务模块用于接收创建任务请求、并从创建任务请求中解析出请求参数;所述Caster任务构建分发模块用于读取API Server服务模块生成的请求参数、渲染出对应的任务脚本并将该任务脚本发布至Airflow调度平台;所述Airflow调度平台包括任务调度模块Scheduler、任务执行单元Worker、任务执行单元管理模块Flower和分布式任务队列Celery和可视化任务调度管理界面WebServer;所述任务调度模块Scheduler用于定时轮询元数据库,对符合运行条件的任务脚本发起运行任务;所述分布式任务队列Celery用于监听任务调度模块Scheduler、领取运行任务形成异步任务队列;所述任务执行单元Worker用于接收Caster任务构建分发模块发布的任务脚本并监听分布式任务队列Celery、基于异步任务队列执行任务脚本;所述任务执行单元管理模块Flower用于监控任务执行单元WorkerNod;所述可视化任务调度管理界面WebServer用于实现用户与Airflow调度平台的可视化交互;所述数据存储模块DB分别连接Caster任务构建分发模块和Airflow调度平台,用于存储构建分发模块Caster和Airflow调度平台运行过程中生成的数据日志。

采用上述技术方案:通过将分布式集群技术运用于任务调度引擎中,实现支持多种任务类型的调度编排,并通过队列绑定Worker,实现调度特定任务到指定Worker节点上。保证特定资源环境隔离,实现资源环境合理利用,以及分布式集群部署。此外,借助Celery分布式队列,简化了Woker的水平扩展,提高任务执行效率和产出稳定性,并能实时监控集群各个Worker节点的资源状态信息并根据资源状态信息实时进行任务调度编排。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海德拓信息技术股份有限公司,未经上海德拓信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010319540.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top