[发明专利]一种混合云环境面向时延优化的科学工作流数据布局方法有效
申请号: | 201810700970.0 | 申请日: | 2018-08-24 |
公开(公告)号: | CN108989098B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 林兵;项滔;卢宇;黄志高;陈星;郭文忠;蔡飞雄 | 申请(专利权)人: | 福建师范大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L29/08;G06N3/12 |
代理公司: | 福州君诚知识产权代理有限公司 35211 | 代理人: | 戴雨君 |
地址: | 350108 福建省福州*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 环境 面向 优化 科学 工作流 数据 布局 方法 | ||
1.一种混合云环境面向时延优化的科学工作流数据布局方法,其特征在于:其包括以下步骤:
步骤1:基于混合云环境下科学工作流构建数据布局方案模型;
整个数据布局方案的定义为S=(DS,DC,Map,Ttotal),其中Map=∪i=1,2,...,|DS|{<dci,dsk,dcj>}表示数据集DS到数据中心集DC的映射关系,映射dci,dsk,dcj表示数据集dsk从源数据中心dci传输到目标数据中心dcj,Ttotal表示数据布局过程中跨数据中心的数据传输所造成的时间总开销;
步骤2:对科学工作流预处理,合并仅有一个相关任务的相邻数据集;
步骤3:初始化种群大小、最大迭代次数、惯性权重因子、认知因子,监督式随机生成初始种群;并初始化第一代粒子的自身历史最优粒子以及初始的种群全局最优粒子;
步骤4:对预处理的数据集采用离散编码方式构建n维候选解粒子;
一个粒子代表混合云环境下科学工作流的一个数据布局方案,粒子i在第t次迭代的位置Xit如公式(11)所示;
每个粒子有n个分位,n代表经过预处理操作后的数据集数量;表示第k个数据集在第t次迭代的存储位置,取值是某个数据中心编号,即
步骤5:将数据布局结果与候选解粒子进行映射处理,获得跨数据中心传输时间和对应的数据布局方案;
步骤6:计算各个编码粒子的适应度,每个粒子设置为其自身历史最优粒子,并选取适应度值最小的可行解粒子作为种群全局最优粒子;
步骤7:基于粒子更新公式更新粒子,并重新计算每个更新粒子的适应度;
步骤8:更新粒子的自身历史最优粒子;
若更新粒子的适应度值小于其自身历史最优值,则将更新粒子设置为其自身历史最优粒子;反之,跳转到步骤10;
步骤9:更新种群全局最优粒子;
若更新粒子的适应度值小于种群全局最优粒子的适应度值,则将更新粒子设置为种群全局最优粒子;
步骤10:检查是否满足达到最大迭代次数的算法终止条件,当满足终止条件时,结束;反之,转到步骤7。
2.根据权利要求1所述的一种混合云环境面向时延优化的科学工作流数据布局方法,其特征在于:步骤1中Ttotal的计算方法:
步骤1-1,映射dci,dsk,dcj表示数据集dsk从源数据中心dci传输到目标数据中心dcj,其数据传输时间Ttransfer如公式(6)所示:
其中dsk表示数据集,dci表示源数据中心,dcj表示传输到目标数据中心,dci、dcj均属于数据中心集DC;dsizek表示数据集dsk大小,bandij表示数据中心dci和数据中心dcj之间的网络带宽的带宽值;
步骤1-2,数据布局过程中跨数据中心的数据传输所造成的时间总开销Ttotal的计算公式如下:
其中eijk={0,1}表示数据布局过程中是否存在数据集dsk从源数据中心dci传输到目标数据中心dcj,如果存在则eijk的值为1,否则为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建师范大学,未经福建师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810700970.0/1.html,转载请声明来源钻瓜专利网。