[发明专利]基于Q学习的异构平台任务调度方法及系统有效
申请号: | 202011284585.6 | 申请日: | 2020-11-17 |
公开(公告)号: | CN112256422B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 高博;李娜;谢宗甫;岳春生;张锋印;董春宵;马金全;余果;郭璐 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50;G06N3/086;G06N3/006 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 平台 任务 调度 方法 系统 | ||
1.一种基于Q学习的异构平台任务调度方法,其特征在于,包含如下内容:
将所有任务作为Q学习的状态空间,处理器集合作为动作空间,等待分配的任务作为当前状态,依据Q学习中任务映射到动作空间所需要的的执行时间来获取任务初始映射方案;
创建遗传算法模型,对任务初始映射方案进行适应度评估,并依据适应度设定遗传算法模型中复制到下一代种群中的个体,对保留个体进行交叉变异,确定新种群优化效率及最小阈值;依据遗传算法模型获取模型中任务到处理器映射的近似最优解;
将模型近似最优解转换为蚁群信息初始信息分布,根据信息分布并通过蚁群算法迭代搜索输出最优路径来获取任务调度最优方案;
系统应用模型表示为G={V,E,C,L},目标系统模型表示为P={N,H,W,T},V为任务集合,E为有依赖关系有向边集合,C为任务计算量集合,L为子任务间通信量,N为处理器集合,H为处理器特征,W为计算开销,T为任务在处理器间的通信开销,依据系统应用模型和目标系统模型两者中的任务集合和处理器集合来获取Q学习的状态空间和动作空间,并采取ε-greedy策略平衡智能体对状态空间的搜索和对已获得信息的利用;
将任务集合V构成状态空间S,处理器集合N作为动作空间A,将等待分配的任务vi作为当前状态s,当前状态的执行动作ni为a;
Q学习智能体根据ε-greedy行为策略在当前状态下执行动作,得到任务映射到处理器的Q值,并获得立即奖励,转移到新状态;以每次动作执行完成的Q值最小为目标,在新状态下选择具有最小Q值的动作执行,并存储,衰减学习率,将下一状态赋予当前状态,根据ε-greedy行为策略选择下一状态下的动作,来迭代执行,以根据存储情况获得任务初始映射方案;
创建遗传算法模型中,对任务初始映射方案进行编码,将任务映射到对应处理器上;并依据适应度评价函数进行适应度评估,将满足适应度值的个体复制直接进入下一代种群,对原保留个体进行交叉变异;利用遗传算法的迭代过程,将每一后代的种群优化效率与最小阈值比较来确定当前种群优化效率,直到连续设定代的后代种群优化效率均比最小阈值小,终止迭代,获取遗传算法模型关于任务与处理器映射的近似最优解集;
适应度评价函数表示为:其中,Q(s,a)表示任务s映射在处理器a的执行时间,t表示迭代代数。
2.根据权利要求1所述的基于Q学习的异构平台任务调度方法,其特征在于,每次迭代中,依据新种群的优化效率设定最小阈值,若每一后代的种群优化效率小于该最小阈值,则将该最小阈值的大小替换为当前种群优化效率。
3.根据权利要求1所述的基于Q学习的异构平台任务调度方法,其特征在于,蚁群算法中,依据任务在处理器所需执行时间长短来确定蚂蚁释放信息素的多少;根据已选择处理器,在禁忌表中记录蚂蚁当前时刻已走过路径;通过迭代输出蚂蚁最优路径来得到任务到处理器的最优分配及任务执行最短时间。
4.一种基于Q学习的异构平台任务调度系统,其特征在于,基于权利要求1所述的方法实现,包含:初始映射模块、适应度评估模块和最优输出模块,其中,
初始映射模块,用于将所有任务作为Q学习的状态空间,处理器集合作为动作空间,等待分配的任务作为当前状态,依据Q学习中任务映射到动作空间所需要的的执行时间来获取任务初始映射方案;
适应度评估模块,用于创建遗传算法模型,对任务初始映射方案进行适应度评估,并依据适应度设定遗传算法模型中复制到下一代种群中的个体,对保留个体进行交叉变异,确定新种群优化效率及最小阈值;依据遗传算法模型获取模型中任务到处理器映射的近似最优解;
最优输出模块,用于将模型近似最优解转换为蚁群信息初始信息分布,根据信息分布并通过蚁群算法迭代搜索输出最优路径来获取任务调度最优方案。
5.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时执行权利要求1~3任一项所述的方法。
6.一种计算机设备,包含处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以执行权利要求1~3任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011284585.6/1.html,转载请声明来源钻瓜专利网。