[发明专利]一种基于工作流吞吐量最大化的工作流调度方法有效
申请号: | 201410101274.X | 申请日: | 2014-03-18 |
公开(公告)号: | CN103838627B | 公开(公告)日: | 2017-05-17 |
发明(设计)人: | 谢军奇;徐秀杰;田国忠;肖创柏 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F9/46 | 分类号: | G06F9/46;G06F9/50 |
代理公司: | 北京思海天达知识产权代理有限公司11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于工作流吞吐量最大化的工作流调度方法,包括用户提交具有执行期限约束的工作流;将工作流转换为有向无环任务模型图DAG;进行DAG任务结点调度;输出工作流吞吐量最大化调度方案,并将其返回给用户;将用户提交的工作流映射到具体的计算资源上执行,完成工作流调度。本发明所述方法考虑多个工作流在异构分布式计算资源上调度,并使工作流完成的数目尽可能多,计算资源利用尽可能充分,克服了现有EDF方法不能根据DAG的不同特征确定调度顺序的缺点,大大提高工作流调度系统的效率,减少了由于没有在规定时间内完成计算而带来的损失,提高系统的用户体验。 | ||
搜索关键词: | 一种 基于 工作流 吞吐量 最大化 调度 方法 | ||
【主权项】:
一种基于工作流吞吐量最大化的工作流调度方法,其特征在于,考虑多个工作流在异构分布式计算资源上调度,通过执行期限约束的工作流吞吐量最大化设计,充分利用计算资源,从而提高工作流的调度效率;所述方法包括以下步骤:步骤1,用户提交具有执行期限约束的工作流;多个用户向工作流调度系统提交具有执行期限约束的的工作流,要求该工作流必须在规定的时间内完成;如果工作流不能在规定时间内完成,反馈信息给用户,用户根据反馈信息选择下一步活动;如果工作流能够在规定的时间内完成,则将工作流的各个任务映射到异构分布式计算资源上调度执行;步骤2,将工作流转换为有向无环任务模型图DAG;步骤2.1,对每一个用户提交的工作流进行预处理;(1)用G=(V,E)表示DAG任务模型图;DAG任务模型图中各个参数的含义如下:G=(V,E)中的V和E:V表示v个任务结点的集合,每个结点代表工作流的一个任务,称为任务结点;E表示e条有向边的集合,每条边代表任务结点之间的先后顺序和数据传递依赖关系;DAG任务模型图由v个任务结点和e条有向边构成;有向边:DAG任务模型图的任意一条有向边记为(ni,nj),ni是有向边的尾任务结点,nj是有向边的头任务结点,i和j分别表示任务结点ni和nj在DAG任务模型图中的编号,且满足i<j;有向边(ni,nj)表示任务结点ni和nj之间的先后顺序和数据传递依赖关系,即任务结点nj必须在任务结点ni的输出数据完整送达以后才能开始执行;有向边的权重值:任务结点之间的数据传递的时间用有向边的权重值表示;当同一个DAG任务模型图的不同任务结点ni和nj在同一个计算资源上执行时,任务结点ni的输出数据不经过网络传输就能被任务结点nj接收,有向边(ni,nj)的权重值为0;当ni和nj在不同的计算资源上执行时,由于不同的计算资源之间是通过网络进行连接,因此有向边(ni,nj)的权重值不为0;出入口结点:在DAG任务模型图中,没有父结点的结点称为DAG入口结点,没有子结点的结点称为DAG出口结点,每个DAG任务模型图有且仅有一个入口结点和一个出口结点;(2)制作表示某个任务结点在某计算资源上的计算时间二维表W;对每个任务进行分类,对每一类固定类型的任务结点,根据以往的经验值可以得出该任务结点在某计算资源上需要多少计算时间,从而得到一个n×m的二维表W,二维表的值表示某个任务结点在某计算资源上的计算时间,n为该DAG任务模型图中任务结点的数量,m为用于执行工作流计算的异构分布式计算资源的数量;所述异构分布式计算资源对同一个任务结点的计算时间是不相同的,因此,对同一个任务结点,在不同的计算资源上有一个不同的计算时间;步骤2.2,计算DAG任务模型图中每个任务结点的向上rank值,公式如下:ranku(ni)=wi‾+maxnj∈succ(ni)(ci,j‾+ranku(nj))]]>式中,为任务ni在m个计算资源上的平均计算时间,wi,k表示任务结点ni在计算资源Mk上的计算时间;succ(ni)为任务结点ni的子任务结点集合;ci,j=Lm+datai,j/Bm,n为任务结点ni和nj在分配的两个计算资源Mm和Mn上的数据传输时间,Lm表示计算资源Mm的数据传输启动时间,datai,j表示从任务结点ni到任务结点nj传输的数据量,任意两个结点之间的数据传递量可以表示为矩阵Datav×v,Bm,n表示从计算资源Mm到计算资源Mn的数据传输速率,Lm和Bm,n都是异构分布式计算环境的已知参数,如果ni和nj被分配在了同一个计算资源上,即m=n,则忽略计算资源内部的数据传递时间,即ci,j=0;是任务结点ni和nj之间的数据传递的平均时间,表示计算资源数据传输启动时间的均值,为数据在计算资源间的平均传输速率,和都是异构分布式计算环境的已知参数;出口任务结点nexit的向上rank值因为任务结点nexit没有子结点,表示出口结点nexit的任务在m个计算资源上的平均计算时间,当ni=nexit时,ranku(ni)=ranku(nexit);在计算DAG任务模型图的每一个任务结点的向上rank值时,将作为计算的初始值,从出口任务结点nexit的向上rank值开始向前推导,即可计算出余下任务结点的向上rank值;rank值可用作任务结点进行调度的优先级,任务结点的向上rank值越大,优先级越高;优先选择优先级高的任务结点进行调度;步骤3,进行DAG任务结点调度;步骤3.1,输入一组步骤2得到的待调度的DAG,每一个待调度有向无环任务模型图Gi具有相应的执行期限约束将该Gi的任务结点按照由步骤2计算得到的向上rank值的大小排序形成一个待调度的任务队列;步骤3.2,对所有DAG任务结点进行调度;步骤4,输出工作流吞吐量最大化调度方案,并将其返回给用户;步骤5,按照步骤4输出的工作流调度方案,将用户提交的工作流映射到具体的计算资源上执行,完成工作流调度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410101274.X/,转载请声明来源钻瓜专利网。