[发明专利]用于分布式ETL任务调度执行的方法及系统有效
申请号: | 201910401322.X | 申请日: | 2019-05-15 |
公开(公告)号: | CN110287245B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 杨冬菊;徐晨阳 | 申请(专利权)人: | 北方工业大学 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/28;G06F9/48;G06F9/50 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;李科 |
地址: | 100041 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的实施例提供了用于分布式ETL任务调度执行的方法和系统,其从获取的待调度执行的ETL任务包含的目标表提取该ETL任务中涉及的实体与附属表之间的关联、实体与维度表之间的关联、实体与实体之间一对多的关联;基于为每种关联预设的权重和每种关联在该ETL任务中的个数确定该ETL任务的调度优先级;以及按照调度优先级从高到低的次序将各个ETL任务分配至各执行节点。本发明实施例的技术方案中基于与ETL任务对应的业务的复杂性、待集成的业务数据的重要程度等因素将ETL任务按不同权重分配至执行节点,满足了核心数据加载的及时性和节点之间的负载均衡性,改善了数据集成的效率和资源的利用率。 | ||
搜索关键词: | 用于 分布式 etl 任务 调度 执行 方法 系统 | ||
【主权项】:
1.一种用于分布式ETL任务调度执行的方法,包括:对于获取的待调度执行的每个ETL任务,基于该ETL任务中数据加载的目标表,提取该ETL任务中涉及的实体与附属表之间的关联、实体与维度表之间的关联、实体与实体之间一对多的关联;基于为每种关联预设的权重和每种关联在该ETL任务中的个数确定该ETL任务的调度优先级;按照调度优先级从高到低的次序将各个ETL任务分配至各执行节点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910401322.X/,转载请声明来源钻瓜专利网。