[发明专利]一种基于可靠性驱动的云资源容错调度方法无效
申请号: | 201210211602.2 | 申请日: | 2012-06-21 |
公开(公告)号: | CN102799474A | 公开(公告)日: | 2012-11-28 |
发明(设计)人: | 张芮;琚春华;陈沛帅 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F9/46 | 分类号: | G06F9/46;G06F9/50 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;王利强 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于可靠性驱动的云资源容错调度方法,包括以下步骤:1)初始化;2)计算DAG中的每个任务i的bl(i)和初始化tl(i)=0;3)将开始任务插入α中;4)开始调度,按如下步骤进行操作,直至所有的任务都调度完成,具体包含如下步骤:4.1)调度时的初始化;4.2)在每个处理机Pj上,寻找任务i的合适处理机;4.3)如果任务i没有可行的处理机,则调度失败;4.4)将处理机分配给任务i;4.5)将任务i的空闲后续放入到α中;4.6)更新U;5)调度结束,调度成功。本发明通过有效的容错调度提高了系统的服务质量。 | ||
搜索关键词: | 一种 基于 可靠性 驱动 资源 容错 调度 方法 | ||
【主权项】:
1.一种基于可靠性驱动的云资源容错调度方法,其特征在于:包括以下步骤:1)初始化,包含如下过程:1.1)将系统支持的最大处理机失败的数量赋值给ε;1.2)确定系统的处理机集P={P1,P2,…,Pm},任务的计算时间用ε:V×P→R来模拟,ε(i,Pj),1≤j≤m表示系统中每个任务在每个处理机上的执行时间;任务间的通信时间用W(i,j)=v(i,j)×d(Pk,Pb)来表示,其中,任务i映射到处理机Pk上,任务j映射到处理机Pb上,d(Pk,Pb)表示发送单位长度数据所需的时间;如果任务部署到同一个处理机上,则通信时间为零;1.3)初始化调度任务集合
未调度任务集合U=V,设S是调度任务集合,U是未调度任务集合,一旦一个任务i∈S调度到处理机Pj上,则会得到它的开始时
和完成时间
利用无回路有向图DAG来模拟任务模型中的任务以及它们之间的关系,用T=(V,E)表示,其中V是一个节点集合对应所有非周期、非抢占性的实时任务;E是一个边集合对应所有任务之间的优先关系以及任务之间的通信;对于一个任务i,Sdp(i)表示任务i的直接前续集合,Sds(i)表示任务i的直接后续集合;v(i,j)表示任务i发送给任务j的数据量;1.4)初始化空闲任务优先列表
该表利用平衡搜索树去执行任务;2)计算无回路有向图DAG中的每个任务i的bl(i)和初始化每个开始任务i的tl(i)=0;tl(i)表示动态高位水平,bl(i)表示静态低位水平;其中tl(i)依赖于映射过程中己经部署的任务,bl(i)根据DAG的拓扑结构将保持不变;其中,bl(i)的求解步骤如下:2.1):对于
如果任务i的后续集合为空,即
则
其中
是任务的平均执行时间,即
否则转到2.2);2.2):bl ( i ) = max j ∈ S ds ( i ) { ϵ ( I ) ‾ + W ( I , J ) ‾ + bl ( j ) } , ]]>
表示任务间的平均通信时间,求解公式为:
其中
表示系统中处理机间发送单位长度数据的平均延迟;3)将开始任务插入α中;4)开始调度,任务的调度过程如下4.1)调度时的初始化,包含以下过程:4.1.1):选择优先权最高的任务,并将H(α)赋值给i;一个任务的优先权由tl(i)+bl(i)来决定,H(α)返回有序队列α中的第一个任务,即是带有最高优先权的任务;4.1.2):初始化可靠性r为0;4.1.3):最早完成时间初始化
4.2)对于每个处理机Pj按如下步骤Step1~Step3进行操作,从第一个处理开始处理,直至将所有的处理机都处理完毕;4.2.1):计算最早完成时间
具体的求解公式如下:t i P ( j ) , ef = ϵ ( i , j ) + max { max u ∈ S dp ( i ) { min k = 1 ϵ + 1 { t u k P ( u k ) , f + W ( u , i ) } } , max i ∈ S ( x ij × t i P ( j ) , f ) } ]]> 其中,
为任务u的第k个副本uk在所在的服务器的处理完成时间;xij=1表示任务i映射到处理机Pj上,否则为xij=0;4.2.2):如果任务i能够在处理机P(ε+1)上达到最早完成时间,且在tr-a(i)之前完成,则确定此时系统的可靠度rj。否则,返回结束此次循环,对下一个处理器进行操作,返回4.2.1);tr-a(i)的作用是限制任务的响应时间,其求解公式为:t r - a ( i ) = min j ∈ S ds { max q ∈ S dp ( j ) { t q P ( q ) , d + W ( q , j ) } } ; ]]> 对于容错调度每个任务有一个调度矩阵
假设系统中一个任务I的ε+1个副本分派到m个处理机上,当任务的副本i分派到处理机Pj时,
否则
其中i=1,2,…,(ε+1),j=1,2,…,m;系统的可靠度的求解公式为:rj=exp(-PR),其中
为副本i在处理机Pj的可靠性,是由事先给定的处理机失败比率λj和i在处理机Pj上的执行时间cij共同决定的;4.2.3):如果满足以下两个条件之一:①rj>r;②rj=r且
则调度任务i到这ε+1个处理机上,然后返回Step1去处理下一个处理机,直至将所有的处理机都处理完毕;4.3)如果对于任务i没有可行的处理机,则返回调度失败;4.4)将处理机分配给任务i;当任务i在处理机上的可靠性最大时;则将任务i放入S中,并同时更新任务i的后续的优先权;4.5)将任务i的空闲后续放入到α中;4.6)更新U,U=U(i);4.7)当未调度任务集合U不为空时,即
则按步骤4.1)到4.6)进行循环操作,直至U为空。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210211602.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种用于自动绕线机上的夹线卸卷装置
- 下一篇:用于耐火材料配置的自动下料装置