[发明专利]一种数据处理方法、装置、电子设备和存储介质在审

专利信息
申请号: 202210158830.1 申请日: 2022-02-21
公开(公告)号: CN114610803A 公开(公告)日: 2022-06-10
发明(设计)人: 罗京;潘广进;何鹏;周礼 申请(专利权)人: 中国民生银行股份有限公司
主分类号: G06F16/25 分类号: G06F16/25;G06F9/445;G06F16/22;G06F16/182;G06Q40/02
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 苏培华
地址: 100031 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据处理 方法 装置 电子设备 存储 介质
【说明书】:

发明实施例提供了一种数据处理方法、装置、电子设备和存储介质,所述方法包括:获取针对业务数据的数据格式信息;将所述数据格式信息输入预先配置的数据处理工具中进行处理,得到针对所述业务数据的作业配置模板;根据所述作业配置模板,导出大数据ETL作业配置文件;所述大数据ETL作业配置文件用于配置针对所述业务数据的ETL作业操作。本发明实施例可以在无需编写代码,只需将整理好的数据格式信息输入预先配置好的数据处理工具的情况下,完成大数据ETL作业的开发工作,降低直接开发大数据ETL作业的技术难度。

技术领域

本发明涉及计算机技术领域,特别是涉及一种数据处理方法、一种数据处理装置、一种电子设备和一种计算机可读存储介质。

背景技术

Hadoop是在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架。由于Hadoop生态圈的技术的更新迭代速度较快,目前还没有支持Hive、Spark、MR等计算引擎的数据ETL(Extract-Transform-Load,抽取-转换-加载)作业自动化生产工具。另外,由于基于大数据的加工处理逻辑和优化策略等与传统的ETL工具存在很大的差别,使得基于TD(Test Director,测试管理)、DS(Data Stage,数据集成)等的开发工具在Hadoop生态圈很难进行应用,导致直接开发大数据作业的技术难度较大。

发明内容

鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据处理方法、一种数据处理装置、一种电子设备和一种计算机可读存储介质。

为了解决上述问题,本发明实施例公开了一种数据处理方法,所述方法包括:

获取针对业务数据的数据格式信息;

将所述数据格式信息输入预先配置的数据处理工具中进行处理,得到针对所述业务数据的作业配置模板;

根据所述作业配置模板,导出大数据ETL作业配置文件;所述大数据ETL作业配置文件用于配置针对所述业务数据的ETL作业操作。

可选地,所述数据格式信息包括数据接口信息;所述将所述数据格式信息输入预先配置的数据处理工具中进行处理,得到针对所述业务数据的作业配置模板,包括:

将所述数据接口信息输入预先配置的数据处理工具,由所述数据处理工具对所述数据接口信息进行配置,得到数据接口配置信息;所述数据接口配置信息为用于从所述业务数据中选择多张数据表进行组合,或选择多个分区和/或分桶字段进行组合的配置信息。

可选地,所述数据格式信息还包括接口列表信息;所述将所述数据格式信息输入预先配置的数据处理工具中进行处理,得到针对所述业务数据的作业配置模板,还包括:

将所述接口列表信息输入所述数据处理工具,由所述数据处理工具对所述接口列表信息进行配置,得到接口列表配置信息;所述接口列表配置信息为用于对所述业务数据进行数据权限控制,或过滤所述业务数据中的无效数据的配置信息。

可选地,所述接口列表信息包括用于配置接口的信息;所述数据处理工具包括贴源层配置模块;所述将所述接口列表信息输入所述数据处理工具,由所述数据处理工具对所述接口列表信息进行配置,得到可用接口列表配置信息,包括:

将用于配置接口的信息导入贴源层配置模块,由所述贴源层配置模块接口导出贴源层配置信息;所述贴源层配置信息包括针对外表进行数据加载的配置信息、针对内表进行数据加工的配置信息、数据质量管理配置信息、数据获取配置信息、接口导出配置信息中的至少一种。

可选地,所述接口列表信息包括用于配置数据模型的信息;所述数据处理工具包括共性加工层配置模块;所述将所述接口列表信息输入所述数据处理工具,由所述数据处理工具对所述接口列表信息进行配置,得到可用接口列表配置信息,还包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民生银行股份有限公司,未经中国民生银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210158830.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top