[发明专利]快速生成大数据平台的ETL作业方法及装置在审
申请号: | 201910778029.5 | 申请日: | 2019-08-22 |
公开(公告)号: | CN110515995A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 周霞 | 申请(专利权)人: | 深圳前海环融联易信息科技服务有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/27;G06F16/28 |
代理公司: | 44242 深圳市精英专利事务所 | 代理人: | 刘萍<国际申请>=<国际公布>=<进入国 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 任务作业 文件类型 系统文件 命令行 时间戳 文件类型定义 参数替换 存放系统 开发周期 快速生成 路径寻找 命令类型 模板作业 设置参数 时间参数 作业过程 大数据 自定义 管控 整合 服务器 工作量 匹配 开发 | ||
1.一种快速生成大数据平台的ETL作业方法,其特征在于:包括以下步骤,
对ETL的作业过程进行整合,形成一个ETL作业模板,所述ETL作业模板包括有多条用于执行ETL作业的命令行;
在执行ETL任务作业时,根据文件的开头定义的文件类型,从服务器中获取与文件类型相匹配的ETL作业模板;
将ETL作业模板的文件类型定义为命令类型,并生成时间戳任务;
根据自定义的路径寻找对应的包,执行时间戳任务的时间类,产生时间参数;
根据系统文件里面的定义的参数值,执行模板作业文件里面的命令行里面的参数替换,完成ETL任务作业,所述系统文件存放系统设置参数。
2.如权利要求1所述的快速生成大数据平台的ETL作业方法,其特征在于:所述用于执行ETL作业的命令行包括,
抽取任务命令行,赋予的参数值包含源数据库、抽取的表名、用户、密码、文件存放目录,使用批量数据迁移的工具执行,将业务系统的数据同步到数据仓库;
转换任务命令行,赋予的参数为指标加工脚本路径,使用命令行客户端工具执行,加工基于业务源数据的指标,并放入数据仓库;
加载任务命令行,赋予的参数为数据仓里指标数据存放的表,目标应用系统数据库地址、表、文件路径,使用批量数据迁移的工具执行,把在数据仓库里面已加工的指标导出到对应的应用系统。
3.一种快速生成大数据平台的ETL作业装置,其特征在于:包括,
ETL作业模板生成模块,用于对ETL的作业过程进行整合,形成一个ETL作业模板,所述ETL作业模板包括有多条用于执行ETL作业的命令行;
ETL作业模板获取模块,用于在执行ETL任务作业时,根据文件的开头定义的文件类型,从服务器中获取与文件类型相匹配的ETL作业模板;
时间戳任务生成模块,用于将ETL作业模板的文件类型定义为命令类型,并生成时间戳任务;
时间参数生成模块,用于根据自定义的路径寻找对应的包,执行时间戳任务的时间类,产生时间参数;
命令行执行模块,用于根据系统文件里面的定义的参数值,执行模板作业文件里面的命令行里面的参数替换,完成ETL任务作业,所述系统文件存放系统设置参数。
4.如权利要求1所述的快速生成大数据平台的ETL作业装置,其特征在于:所述用于执行ETL作业的命令行包括,
抽取任务命令行,赋予的参数值包含源数据库、抽取的表名、用户、密码、文件存放目录,使用批量数据迁移的工具执行,将业务系统的数据同步到数据仓库;
转换任务命令行,赋予的参数为指标加工脚本路径,使用命令行客户端工具执行,加工基于业务源数据的指标,并放入数据仓库;
加载任务命令行,赋予的参数为数据仓里指标数据存放的表,目标应用系统数据库地址、表、文件路径,使用批量数据迁移的工具执行,把在数据仓库里面已加工的指标导出到对应的应用系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海环融联易信息科技服务有限公司,未经深圳前海环融联易信息科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910778029.5/1.html,转载请声明来源钻瓜专利网。