[发明专利]一种支持多任务重跑的调度方法有效
申请号: | 201911052270.6 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110825507B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 李跃;余侍俊;陈永礼;陈俊洁 | 申请(专利权)人: | 杭州米络星科技(集团)有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48 |
代理公司: | 杭州橙知果专利代理事务所(特殊普通合伙) 33261 | 代理人: | 贺龙萍 |
地址: | 310012 浙江省杭州市拱*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 支持 任务 调度 方法 | ||
1.一种支持多任务重跑的调度方法,其特征是,具体包括如下步骤:
(1)在Azkaban框架下按照project、flow、job 依次来管理的,即一个project 中包含多个调度流程flow,每个调度流程flow中有多个job;
(2)解析每个job中的sql,得到读取的表列表、写入的表列表;
(3)每个job 包装一个前置任务,前置任务检查读取的表列表是否准备就绪,如果就绪继续执行当前job,如果还没有准备就绪,该前置任务一直轮询直到所有表准备就绪;
(4)与此同时,每个job 包装一个后置任务,后置任务用来标记所有写入的表列表的状态为就绪状态,以便后续依赖这些表的任务执行;
(5)在后台展示所有job的依赖关系图,用一种颜色表示执行失败,当遇到执行失败时,只要修复好当前节点涉及的表,其他任务就能自动往下执行;
其中,在步骤(3)和步骤(4)中,前置任务会一直轮询依赖资源的状态,当依赖的资源已准备就绪,才启动job执行,保证job在执行的时候所有资源都准备就绪了;后置任务主要是将自己完成修改的资源状态修改为就绪,方便其他下游任务及时检测到,并启动job;通过将状态记录到数据库,方便写入和读取;前置任务、job、后置任务是对一个job的封装,是串行结构。
2.根据权利要求1所述的一种支持多任务重跑的调度方法,其特征是,在步骤(2)中,通过以下两个阶段来得到读取的表列表、写入的表列表:第一阶段是人工整理并录入数据库,第二阶段是通过封装apache hive 这个开源项目里面的SQL解析模块来实现。
3.根据权利要求1所述的一种支持多任务重跑的调度方法,其特征是,在步骤(5)中,在后台展示所有job的依赖关系图,用一种颜色表示执行成功,另一种颜色表示执行失败,从而根据表的依赖关系得到数据血缘关系图,根据数据血缘关系图,当遇到执行失败时,只要修复好当前节点涉及的表,其他任务就能自动往下执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州米络星科技(集团)有限公司,未经杭州米络星科技(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911052270.6/1.html,转载请声明来源钻瓜专利网。