[发明专利]一种数据处理与控制逻辑分离的ETL调度方法和装置有效
申请号: | 201611260460.3 | 申请日: | 2016-12-30 |
公开(公告)号: | CN108268494B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 胡国靖;王国飞;李光瑞;汪远航;罗志成 | 申请(专利权)人: | 中移(苏州)软件技术有限公司;中国移动通信集团公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张颖玲;王花丽 |
地址: | 215163 江苏省苏州市高*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 控制 逻辑 分离 etl 调度 方法 装置 | ||
本发明实施例公开了一种数据处理与控制逻辑分离的ETL调度方法和装置,所述方法包括:在全部已发布的抽取转换装载ETL任务中查找当前ETL任务;当在全部已发布的ETL任务中没有查找到所述当前ETL任务时,获取所述当前ETL任务对应的当前控制流;其中,所述当前控制流中至少包括:所述当前ETL任务对应的当前数据流;根据所述当前控制流对所述当前ETL任务进行调度。不仅能够简化ETL任务的调度流程,而且还可以提高ETL任务的调度效率。
技术领域
本发明涉及数据处理技术,尤其涉及一种数据处理与控制逻辑分离的ETL调度方法和装置。
背景技术
随着大数据技术发展,分布式的数据存储系统越来越多,大数据应用一般需要集成多个不同的数据存储系统来构建不同应用的数据仓库。传统的数据抽取转换装载ETL是指在构建数据仓库的过程中对数据源中的数据经过抽取(Extract)、转换(Transform)、装载(Load)到数据仓库的过程。
图1为现有技术中ETL任务的组成结构示意图。如图1所示,ETL任务的数据处理过程为:先读取配置数据库中的基本对象配置,按照各模板的配置依次从源数据库中抽取数据,将其存储到临时数据库中;然后将抽取数据存储到临时数据库后,再根据一定的转换规则,对抽取的数据进行转换;数据转换完成后再对其进行一些必要的处理,清除那些不正确的,不完整的数据,再对数据的格式等进行加工,最后装载到目标数据库中。也就是说,在ETL的调度过程中,主要包括数据处理和逻辑控制两个方面。其中,数据处理包括:抽取、转换和装载;逻辑控制包括:依赖、等待、定时和调度。
在现有ETL任务的调度方法中,通常将当前ETL任务的数据处理和控制逻辑作为一个整体的调度单元进行调度。例如,假设当前ETL任务中包括三个子任务,分别为:任务A、任务B和任务C;任务C依赖于任务A和任务B。采用现有ETL任务的调度方法,先在预先保存的全部ETL任务中查找当前ETL任务;当在预先保存的全部ETL中没有查找到当前ETL时,需要先创建当前ETL任务的各个子任务,然后再根据各个子任务创建当前ETL任务。即:先创建任务A、任务B和任务C;然后根据任务A、任务B和任务C创建当前ETL任务。这样就会大大增加调度ETL的复杂度,降低ETL的调度效率。
发明内容
为解决上述技术问题,本发明实施例期望提供一种数据处理与控制逻辑分离的ETL调度方法和装置,不仅能够简化ETL任务的调度流程,而且还可以提高ETL任务的调度效率。
本发明的技术方案是这样实现的:
本发明实施例提供了一种数据处理与控制逻辑分离的ETL调度方法,所述方法包括:
在全部已发布的ETL任务中查找当前ETL任务;
当在全部已发布的ETL任务中没有查找到所述当前ETL任务时,获取所述当前ETL任务对应的当前控制流;其中,所述当前控制流中至少包括:所述当前ETL任务对应的当前数据流;
根据所述当前控制流对所述当前ETL任务进行调度。
在上述实施例中,所述获取所述当前ETL任务对应的当前控制流,包括:
通过预先设置的控制流组件在全部已发布的控制流中查找所述当前控制流;
当在全部已发布的控制流中查找到所述当前控制流时,在全部已发布的控制流中获取所述当前控制流。
在上述实施例中,所述方法还包括:
当在全部已发布的控制流中没有查找到所述当前控制流时,通过所述控制流组件中的调用数据流组件在全部已发布的数据流中查找所述当前ETL任务对应的当前数据流;
当在全部已发布的数据流中查找到所述当前数据流时,在全部已发布的数据流中获取所述当前数据流;
根据所述当前数据流创建所述当前控制流。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(苏州)软件技术有限公司;中国移动通信集团公司,未经中移(苏州)软件技术有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611260460.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于地理位置的最近站点搜索方法及装置
- 下一篇:基于大数据的网络用户分类系统