[发明专利]一种基于增强拓扑神经进化的等效并行机动态智能调度方法在审
申请号: | 202210259971.2 | 申请日: | 2022-03-16 |
公开(公告)号: | CN114545884A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 周升伟;陈亚绒;黄沈权;付培红;朱立夏;钟柳艳 | 申请(专利权)人: | 温州大学 |
主分类号: | G05B19/418 | 分类号: | G05B19/418 |
代理公司: | 杭州万合知识产权代理事务所(特殊普通合伙) 33294 | 代理人: | 余冬 |
地址: | 325006 浙江省温州市瓯海区瓯海*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 增强 拓扑 神经 进化 等效 并行 机动 智能 调度 方法 | ||
1.一种基于增强拓扑神经进化的等效并行机动态智能调度方法,其特征在于:按下述步骤进行:
步骤S1:初始化等效并行机系统参数,定义机器Mi数m(i=1,2,…,m),工件类型Jj数n(j=1,2,…,n),工件Jj的数量npj、到达时间rj、处理时间pj以及机器弹性预防维护的界限值UT和维护时间t;
步骤S2:研究等效并行机问题的动态调度决策特征,设计与之匹配的调度行为,组成强化学习智能体的行为空间A;
步骤S3:研究等效并行机问题的动态调度环境特点,设计从工件、机器与暂存区三个维度描述环境的状态空间向量S;
步骤S4:生成规模为N的初始神经网络种群Pop,每一个初始神经网络个体都只有输入层和输出层而无隐藏层;
步骤S5:将目标值平均流程时间的倒数设置为适应度值函数,用于评价神经网络个体的优劣;
步骤S6:种群Pop中的每一个智能体所用的神经网络个体分别与等效并行机系统交互,感知实时状态,在新工件类型到达或工件完工的每一个决策时刻选择一种调度行为,通过一系列的动态决策,生成调度策略,得到适应度值;神经网络种群采用基于物种相容性阈值的种群分化、五种方式变异、交叉以及停滞物种淘汰等方式实现遗传进化,得到适应度值最高的神经网络Pbest;
步骤S7:使用步骤S6训练得到的最优神经网络Pbest作为调度智能体,当新工件到达或者工件完工时触发决策时刻,将实时车间环境状态S输入Pbest,Pbest输出行为空间中各行为的Q值{Q1,Q2,Q3},智能体选择Q值最大的行为a=argmaxQ生成最优调度方案。
2.根据权利要求1所述的基于增强拓扑神经进化的等效并行机动态智能调度方法,其特征在于:所述步骤S1中的初始化等效并行机系统按下述步骤进行:
步骤S1.1:问题描述与目标界定,等效并行机动态调度问题可以描述为将n类工件J={J1,J2,…,Jj,…,Jn},安排到m台等效的并行机上,其中每类工件Jj的数量np={np1,np2,…,npj,…,npn},每类工件Ji的到达时间为r={r1,r2,…rj,…rn},每类工件的处理时间为p={p1,p2,…,pj,…pn},任何工件在加工过程不可中断,机器在生产过程中需要进行弹性预防维护,即机器的连续加工时间或役龄不能超过界限值UT,每次维护的时间为t,优化目标为最小化平均流程时间决策内容是确定工件在机器上的分配与加工顺序;
步骤S1.2:初始化等效并行机数字仿真模型,使用Spyder软件进行编程,按照调度问题的基本构成生成三个列表list1、list2、list3,分别存储各类工件的加工时间pj、各类工件的到达时间rj和各类工件的数量npj,初始化机器弹性预防维护界限UT值和维护时间t值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210259971.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种体育教学用可调式便捷投篮设备
- 下一篇:一种物理质控品及其制备方法和应用