[发明专利]一种自动化ETL数据处理工具及其使用方法在审

专利信息
申请号: 201811078167.4 申请日: 2018-09-16
公开(公告)号: CN109359146A 公开(公告)日: 2019-02-19
发明(设计)人: 赵明 申请(专利权)人: 安徽三实软件科技有限公司
主分类号: G06F16/25 分类号: G06F16/25
代理公司: 北京力量专利代理事务所(特殊普通合伙) 11504 代理人: 毛雨田
地址: 230088 安徽省合肥市高*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 任务创建模块 数据加载模块 数据转换模块 数据抽取模块 数据处理工具 数据存储模块 数据输出模块 自动化 计算机领域 开发效率 导出
【说明书】:

发明属于计算机领域并公开了一种自动化ETL数据处理工具及其使用方法;包括数据抽取模块、数据转换模块、任务创建模块、数据加载模块、数据存储模块和数据输出模块;所述的数据抽取模块与数据转换模块连接,所述的数据转换模块与任务创建模块连接,所述任务创建模块与数据加载模块连接,所述数据加载模块与数据输出模块连接,所述数据抽取模块、数据转换模块、任务创建模块、数据加载模块均与数据存储模块连接;本发明的自动化ETL数据处理工具可减少频繁地导入导出ETL工具降低处理速度的情况,进而较现有技术有效提高了处理速度和开发效率。

技术领域

本发明涉及计算机技术领域,尤其涉及一种自动化ETL数据处理工具及其使用方法。

背景技术

随着大数据业务的快速发展,对数据进行ETL处理就变得非常的普遍。ETL处理的过程大致是将来自不同数据源中的数据抽取后进行清洗、转换、集成处理,即数据抽取、数据转换、数据加载等处理,并将处理后的数据置入目标数据仓库中。目前,存在多种不同类型的数据源,例如:关系型Mysql、非关系型HBase、数据仓库有Hive、文件存储HDFS、具有存储功能的文件索引服务Elasticsearch;而不同的数据类型的数据源可能会具有不同的接口类型。然而,针对不同的接口类型的数据源技术人员需要开发不同的ETL处理工具进行ETL处理,这样不仅增加了技术开发人员的工作量,而且开发效率也会偏低。鉴于现有技术中的缺点,如何提供一种使用简单、运行速度快、开发效率高的自动化ETL数据处理工具及其使用方法是本领域技术人员需要解决的技术难题。

发明内容

针对现有技术中的上述不足之处,本发明提供了一种自动化ETL数据处理工具及其使用方法。

本发明为解决上述技术问题,采用以下技术方案来实现:

设计一种自动化ETL数据处理工具,包括数据抽取模块、数据转换模块、任务创建模块、数据加载模块、数据存储模块和数据输出模块;

所述的数据抽取模块与所述的数据转换模块连接,且所述的数据抽取模块用于获取数据源中的源数据,并将获取的源数据传递至所述的数据转换模块中;

所述的数据转换模块与所述的任务创建模块连接,且所述的数据转换模块用于将接收到的源数据转换成CSV格式数据,并将所述的CSV格式数据传递至任务创建模块中;

所述的任务创建模块与所述的数据加载模块连接,且所述的任务创建模块用于依据所述的CSV格式数据来创建ETL任务;

所述的数据加载模块与所述的数据输出模块连接,且所述的数据加载模块用于根据创建的ETL任务来执行、加载该ETL任务;

所述的数据输出模块用于将ETL任务执行、加载以后的结果发送至目标数据仓库;

所述的数据存储模块均与数据抽取模块、数据转换模块、任务创建模块以及数据加载模块连接,其用于存储输入数据、中间数据以及ETL任务执行以后的结果。

优选的,所述的数据抽取模块还包括对数据源中的源数据进行归一化处理。

优选的,所述数据加载模块的架构为ETL架构、ELT架构中的一种。

设计一种自动化ETL数据处理工具的使用方法,包括如下步骤:

步骤一:数据抽取模块获取数据源中的源数据,并将获取的源数据传递至所述的数据转换模块中;

步骤二:数据转换模块将接收到的源数据转换成CSV格式数据;

步骤三:任务创建模块依据所述的CSV格式数据来创建ETL任务;

步骤四:数据加载模块用于根据创建的ETL任务来执行、加载该ETL任务;

步骤五:数据输出模块将ETL任务执行、加载以后的结果发送至目标数据仓库中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽三实软件科技有限公司,未经安徽三实软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811078167.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top