[发明专利]基于可视化界面快速生成分布式批处理任务的方法和装置在审
申请号: | 202110906348.7 | 申请日: | 2021-08-09 |
公开(公告)号: | CN113742040A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 张鑫;毕阳洋;段智永;曹杰 | 申请(专利权)人: | 广州市易工品科技有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F16/2455 |
代理公司: | 广州智斧知识产权代理事务所(普通合伙) 44649 | 代理人: | 孔德超 |
地址: | 510000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 可视化 界面 快速 生成 分布式 批处理 任务 方法 装置 | ||
1.一种基于可视化界面快速生成分布式批处理任务的方法,其特征在于,包括:
接收使用者在可视化界面填写的配置信息,所述配置信息包括spark配置信息、Input配置信息、transform配置信息以及Output配置信息;
将所述配置信息组织成配置文件,并存入存储介质中;
接收使用者的任务启动请求,调取所述配置文件,并将所述配置文件传入后台的执行引擎中,由所述执行引擎解析所述配置文件信息,生成spark任务,调度执行批处理任务。
2.根据权利要求1所述的基于可视化界面快速生成分布式批处理任务的方法,其特征在于,所述可视化界面为web页面。
3.根据权利要求1所述的基于可视化界面快速生成分布式批处理任务的方法,其特征在于,所述spark配置信息包括spark-app的名称、调度平台以及资源;所述Input配置信息包括数据源的信息和读取数据时的配置信息;所述transform配置信息包括配置SQL和临时表的名称,所述SQL和临时表设置为一组或多组;所述Output配置信息包括数据落信息和落地库的配置信息。
4.根据权利要求3所述的基于可视化界面快速生成分布式批处理任务的方法,其特征在于,接收使用者的任务启动请求,调取所述配置文件,并将所述配置文件传入后台的执行引擎中,由所述执行引擎解析所述配置文件信息,生成spark任务,调度执行批处理任务,包括:
所述可视化界面的管理界面接收使用者在所述管理界面操作产生的任务启动请求;
基于所述任务请求,通过所述管理界面调取所述配置文件,并将调取的配置文件传送到后台的执行引擎中;
执行引擎解析所述配置信息,生成spark任务,并将所述spark任务发送至所述调度平台,通过所述调度平台基于所述Input配置信息和transform配置信息调度执行批处理任务,并将批处理结果存储于Output对应的配置信息。
5.根据权利要求1-4任一项所述的基于可视化界面快速生成分布式批处理任务的方法,其特征在于,所述执行引擎为java代码,通过脚本java–jar的形式启动。
6.一种基于可视化界面快速生成分布式批处理任务的装置,其特征在于,包括:
接收单元,用于接收使用者在可视化界面填写的配置信息,所述配置信息包括spark配置信息、Input配置信息、transform配置信息以及Output配置信息;
组织单元,用于将所述配置信息组织成配置文件,并存入存储介质中;
处理单元,用于接收使用者的任务启动请求,调取所述配置文件,并将所述配置文件传入后台的执行引擎中,由所述执行引擎解析所述配置文件信息,生成spark任务,调度执行批处理任务。
7.根据权利要求6所述的基于可视化界面快速生成分布式批处理任务的装置,其特征在于,所述可视化界面为web页面。
8.根据权利要求6所述的基于可视化界面快速生成分布式批处理任务的装置,其特征在于,所述spark配置信息包括spark-app的名称、调度平台以及资源;所述Input配置信息包括数据源的信息和读取数据时的配置信息;所述transform配置信息包括配置SQL和临时表的名称,所述SQL和临时表设置为一组或多组;所述Output配置信息包括数据落信息和落地库的配置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市易工品科技有限公司,未经广州市易工品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110906348.7/1.html,转载请声明来源钻瓜专利网。