[发明专利]支持依赖和时间平衡的云工作流任务聚类方法在审
申请号: | 201710202595.2 | 申请日: | 2017-03-30 |
公开(公告)号: | CN106991006A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 严伟;杨朔;杨威;吕跃华;陶砾;施扬朋 | 申请(专利权)人: | 浙江天正信息科技有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杜军 |
地址: | 310006 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种支持依赖和时间平衡的云工作流任务聚类方法。本发明在对流程图中同一层级的任务进行聚类时优先考虑了任务之间的数据依赖关系,并考虑了聚类之间的时间平衡,本发明在对同一层级的任务进行聚类时并不是简单地将具有相同子任务的父任务聚集在一起,而是综合考虑了这些任务共有的子任务以及它们各自特有的子任务,在此基础上提出了任务关联度的概念和计算公式来表征任务之间的依赖程度。同时,本发明在优先考虑任务之间的依赖关系的基础上还考虑了各个任务的运行时间,同时保证了聚类的依赖平衡与时间平衡。通过与传统聚类方法进行实验比较可以发现,本发明对任务进行聚类可以更有效地减少工作流的完成时间。 | ||
搜索关键词: | 支持 依赖 时间 平衡 工作流 任务 方法 | ||
【主权项】:
1.支持依赖和时间平衡的云工作流任务聚类方法,其特征在于包括如下步骤:步骤(1).输入流程图中某一层待聚类的任务集taskList;流程图是工作流W=(T,E)的图形化表示,通过有向无环图来描述;其中T={t1 ,t2 ,...,tm }是顶点的集合,代表流程中的任务;E是有向边的集合,代表任务之间的依赖关系;流程图中从开始任务到某个任务所经过的有向边的条数称为该任务所在的层数;步骤(2).计算该层任务中任意两个任务之间的关联度cor(ti ,tj );关联度的计算公式如下: c o r ( t i , t j ) = | c ( t i ) ∩ ( t j ) | | c ( t i ) | · | c ( t j ) | ]]> 其中c(ti )表示任务ti 的下一层子任务集合,|c(ti )|表示任务ti 的下一层子任务个数;步骤(3).输入一个不超过该层任务总数n的聚类个数clusterNum,根据该聚类个数对该层的任务总数进行均分,得出每个聚类Ci 需要填充的任务个数;设n/clusterNum的商数为p、余数为q,则前q个聚类需要填充的任务个数为p+1,其余聚类需要填充的任务个数为p;步骤(4).按聚类C1 、C2 …CclusterNum 的顺序,根据聚类Ci 需要填充的任务个数对聚类Ci 进行任务填充;特别地,当聚类Ci 中所需任务个数为1时,则将剩余未分配的各个任务分别填充至聚类Ci 、Ci+1 …CclusterNum 中,聚类结束,转至步骤(7);否则,从剩余任务中找到关联度最大的两个任务放到聚类Ci 中;若有多个任务对的关联度都达到了最大,则选择任务对中两任务运行时间之和最接近 的任务对填充到聚类Ci 中,其中n表示该层包含的任务个数,RT(ti )表示任务ti 的执行时间;步骤(5).若此时聚类Ci 中已有的任务个数小于需要填充的任务个数,则计算剩余任务中的每个任务分别加入聚类Ci 后Ci 中所有任务对的关联度之和,选择使得关联度之和达到最大的那个任务填充到聚类Ci 中,如果满足上述条件的任务有多个,则在这几个任务中选择运行时间最接近聚类Ci 中剩余平均运行时间leftTaskTime的任务,其中聚类Ci 中剩余平均运行时间的计算公式如下: l e f t T a s k T i m e = Σ i = 1 n R T ( t i ) c l u s t e r N u m - c u r T a s k T i m e ( C i ) n e e d N u m ( C i ) - c u r T a s k N u m ( C i ) ]]> 其中curTaskTime(Ci )表示聚类Ci 中已经填充的任务的运行时间之和,curTaskNum(Ci )表示聚类Ci 中已经填充的任务数,needNum(Ci )为聚类Ci 需要填充的任务个数,n表示该层包含的任务个数;步骤(6).按步骤(5)继续向聚类Ci 中填充任务,直至填充完毕,然后跳至步骤(4),继续下一个聚类的填充,直到所有的聚类都填充完毕;步骤(7).输出聚类结果Ci ,i=1,2,...,clusterNum。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江天正信息科技有限公司,未经浙江天正信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710202595.2/,转载请声明来源钻瓜专利网。
- 上一篇:操作系统的切换方法及装置
- 下一篇:一种基于GPU片上的数据处理方法及设备