[发明专利]一种支持可视化和流程化的大数据ETL调度系统有效

专利信息
申请号: 201710316129.7 申请日: 2017-05-08
公开(公告)号: CN107145576B 公开(公告)日: 2020-06-23
发明(设计)人: 陈思恩;杨紫胜;廖雅哲;林振州 申请(专利权)人: 科技谷(厦门)信息技术有限公司
主分类号: G06F16/25 分类号: G06F16/25;G06F16/215;G06F11/30;G06F9/48
代理公司: 厦门致群专利代理事务所(普通合伙) 35224 代理人: 刘兆庆;邓贵琴
地址: 361009 福建省厦门市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 支持 可视化 流程 数据 etl 调度 系统
【说明书】:

发明公开了一种支持可视化和流程化的大数据ETL调度系统,基于B/S架构实现,其包括大数据组件操作单元、ETL作业管理模块、ETL调度管理模块、系统管理模块及作业配置数据库,所述ETL作业管理模块、ETL调度管理模块与大数据组件操作单元彼此独立、互不影响。本发明有效摒弃复杂的后台操作,极大提升了ETL的开发速度和效率,同时降低了企业项目实施的成本。

技术领域

本发明涉及大数据处理技术领域,特别涉及一种支持可视化和流程化的大数据ETL调度系统。

背景技术

ETL(Extract-Transform-Load,提取、转换和加载)是BI(大数据)项目最重要的一个环节,通常情况下ETL会花掉整个项目的1/3的时间,ETL设计的好坏直接关接到BI项目的成败。

大数据ETL也是一个长期的过程,只有不断的发现问题并解决问题,才能使ETL运行效率更高,为项目后期开发提供准确的数据。大数据ETL负责将分散的、异构数据源中的数据如关系数据、平面数据文件等抽取到大数据平台系统后,进行清洗、转换、集成,最后加载到大数据平台、数据仓库或数据集市中,成为联机分析处理、数据挖掘提供决策支持的数据。这个过程通常都需要在后台进行相关操作,且后台操作复杂,降低了ETL的开发速度和效率,同时对于集群来说可能存在着误操作的风险,大大增加企业项目实施成本。

发明内容

为解决上述问题,本发明提供了一种支持可视化和流程化的大数据ETL调度系统,其能够有效摒弃复杂的后台操作,极大提升了ETL的开发速度和效率,同时降低了企业项目实施的成本。

本发明采用以下技术方案:

一种支持可视化和流程化的大数据ETL调度系统,基于B/S架构实现,其包括大数据组件操作单元、ETL作业管理模块、ETL调度管理模块、系统管理模块及作业配置数据库,所述ETL作业管理模块、ETL调度管理模块与大数据组件操作单元彼此独立、互不影响,其中:

所述大数据组件操作单元包括支持可视化操作的数据查询模块、组件脚本编辑模块、脚本执行监控模块、平台组件驱动模块、大数据平台、本地业务系统及远程业务系统;

所述ETL作业管理模块用于对大数据抽取、清洗、加载的配置提供可视化操作,并生成JSON或XML格式作业配置文件进行提交或保存到作业配置数据库;

所述ETL调度管理模块用于进行ETL作业的定时调度工作以及完成对ETL作业执行过程的监控,并生成作业监控结果;

所述系统管理模块用于针对系统各模块提供用户、角色、资源的管理以及访问权限控制,其包括资源管理子模块、权限管理子模块及系统驱动子模块,所述驱动子模块连接所述作业配置数据库。

优选地,所述ETL作业管理模块包括抽取配置子模块、清洗配置子模块、加载配置子模块,所述抽取配置子模块用于实现大数据抽取的可视化操作,所述清洗配置子模块用于实现大数据清洗的可视化操作,所述加载配置子模块用于实现大数据加载的可视化操作。

优选地,所述ETL调度管理模块包括流程配置子模块、作业调度子模块及调度监控子模块,所述流程配置子模块用于提供ETL作业流程配置的可视化操作,生成ETL作业列表存储到作业配置数据库,以及从作业配置数据库中读取ETL作业列表,所述作业调度子模块连接流程配置子模块,用于实现ETL作业的定时调度工作,所述调度监控子模块用于对ETL作业执行过程进行监控,并生成作业监控结果。

优选地,所述作业监控结果包括ETL作业的日志、状态、结果以及告警信息。

优选地,所述大数据平台的组件包括HDFS、Hive、HBase、Solr、YARN、Oozie、Spark、Storm、Sqoop、Pig、Impala、Zookeeper。

采用上述技术方案后,本发明与背景技术相比,具有如下优点:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科技谷(厦门)信息技术有限公司,未经科技谷(厦门)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710316129.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top