[发明专利]数据处理流程的生成方法、装置和电子设备在审
申请号: | 202210103336.5 | 申请日: | 2022-01-27 |
公开(公告)号: | CN114579090A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 叶盛 | 申请(专利权)人: | 奇安信科技集团股份有限公司;奇安信网神信息技术(北京)股份有限公司 |
主分类号: | G06F8/20 | 分类号: | G06F8/20;G06F8/30;G06F8/41 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王宇杨 |
地址: | 100088 北京市西城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 流程 生成 方法 装置 电子设备 | ||
本发明提供一种数据处理流程的生成方法、装置和电子设备,其中方法包括:确定处理待处理数据所需的多个节点;基于多个节点构造数据处理流程结构;其中,所述数据处理流程结构中节点之间的顺序用于指示节点之间的连接关系;基于所述数据处理流程结构中节点之间的顺序,对所述数据处理流程结构进行解析,得到解析数据;基于所述解析数据生成数据处理流程。本发明提供的数据处理流程的生成方法、装置和电子设备,无需逐个连接每个节点,从而提高了数据处理流程的生成效率。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据处理流程的生成方法、装置和电子设备。
背景技术
Flink和Spark等大数据处理平台在进行数据处理之前,往往需要先生成数据处理流程。
相关技术中,通常通过包装节点,构造流程引擎,然后再使用可视化的流程编辑工具来编辑数据处理流程。
但上述相关技术中,需要逐个创建和编辑每个节点,再保存确认,而且还需要按照数据处理流程逐个连接每个节点,从而降低了数据处理流程的生成效率。
发明内容
针对现有技术存在的问题,本发明提供一种数据处理流程的生成方法、装置和电子设备。
本发明提供一种数据处理流程的生成方法,包括:
确定处理待处理数据所需的多个节点;
基于多个节点构造数据处理流程结构;其中,所述数据处理流程结构中节点之间的顺序用于指示节点之间的连接关系;
基于所述数据处理流程结构中节点之间的顺序,对所述数据处理流程结构进行解析,得到解析数据;
基于所述解析数据生成数据处理流程。
根据本发明提供的一种数据处理流程的生成方法,所述确定处理待处理数据所需的多个节点,包括:
获取流程定义规则;其中,所述流程定义规则是基于处理所述待处理数据时用到的节点、节点的类型和配置信息制定的;所述配置信息用于指示对所述待处理数据在所述节点下进行的数据处理;
基于所述流程定义规则确定处理所述待处理数据所需的所述多个节点;
所述基于所述多个节点构造数据处理流程结构,包括:
基于所述流程定义规则确定所述多个节点中每个节点的类型和配置信息;
基于每个节点的类型和所述配置信息构造数据处理流程结构;
其中,所述节点的类型包括以下任一项:输入节点、输出节点、处理节点和结构节点;所述结构节点包括以下任一项:复制节点、分发节点、联合节点、连接节点和跳转节点。
根据本发明提供的一种数据处理流程的生成方法,所述基于所述数据处理流程结构中节点之间的顺序,对所述数据处理流程结构进行解析,得到解析数据,包括:
基于所述数据处理流程结构中节点之间的顺序,依次读取所述数据处理流程结构中的各个节点;
获取所述各个节点的类型和配置信息;
基于所述各个节点的类型和配置信息对对应节点进行解析,得到所述对应节点的解析数据。
根据本发明提供的一种数据处理流程的生成方法,所述基于所述各个节点的类型和配置信息对对应节点进行解析,得到所述对应节点的解析数据,包括:
在当前节点为输入节点、且所述当前节点为首节点的情况下,基于所述输入节点的配置信息构造输入流;
将所述输入流确定为当前数据流,得到所述当前节点的解析数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奇安信科技集团股份有限公司;奇安信网神信息技术(北京)股份有限公司,未经奇安信科技集团股份有限公司;奇安信网神信息技术(北京)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210103336.5/2.html,转载请声明来源钻瓜专利网。