[发明专利]一种基于强化学习的线缆生产调度优化方法有效
申请号: | 202010299221.9 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111507523B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 林剑;宋洪波;王周敬 | 申请(专利权)人: | 浙江财经大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/0631;G06Q50/04;G06N20/00 |
代理公司: | 温州市品创专利商标代理事务所(普通合伙) 33247 | 代理人: | 洪中清 |
地址: | 310000 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 线缆 生产 调度 优化 方法 | ||
1.一种基于强化学习的线缆生产调度优化方法,其特征在于,该方法包括如下步骤:
步骤1、建立线缆生产调度问题的约束优化数学模型;
设定线缆生产线中共有m台机器,有N个待生产订单{J1,J2,…,JN},每个订单Ji(i=1,2,…,N)根据线缆产品型号的生产工艺要求对应n个工序集合Oi={Oi1,Oi2,…,Oin};一个订单只包含一种线缆产品规格,设定用于工艺环节g(g=1,2,…,6)生产的机器集合为Mg,Ggh表示工艺环节g上第h个生产规格,为订单Ji在工艺环节g上对应的生产规格,G′gh为生产线缆规格Ggh时相应的可用模具套数;在机器Mk(k=1,2,…,m)上生产,若需要从订单Ji切换到另一订单Ji′,且Ji和Ji′两个订单对应的线缆规格不同,则所需更换模具的时间为Sii′k;设定工序Oij(i=1,2,…,N;j=1,2,…,n)的开始时间和完工时间分别为Bij和Cij;设定机器k上生产订单Ji的开始时间和完工时间分别为B′ik和C′i′k;以截止期延期惩罚费用最小化为优化目标,合理安排不同作业相应工序的加工设备和时序;线缆生产调度问题目标函数为:
其中,Di为订单Ji对应的交货截止期,Ci为订单Ji的完工时间,wi为截止期各订单紧急权重因子;
约束条件如下:
其中,约束(2)给定了同一个订单Ji中后一个工序的开始时间必须要在前一个工序结束后才能开始加工;约束(3)给定了机器k上紧后工序必须要在前一工序结束后才能开始加工;
步骤2、初始化优化算法和强化学习参数;
2.1、初始化算法参数:当前迭代次数t,最大迭代次数maxT,周期迭代次数T;
2.2、生成初始解:随机生成一个由N个订单对应工序所组成的初始解,即Xt=Ruffled{O1,O2,…,ON},Ruffled(·)为随机打乱顺序操作;
步骤3、随机选取初始状态st以及st对应的某一个动作χt(χt∈A);
步骤4、将χt作为搜索算子应用到Xt,并连续运行T次,每次运行时,采用最小完工时间优先作为标准,生成调度方案,
若得到的新解更优,则替换原有解,T次运行结束后按照公式(7)计算得到λ值;
步骤5、根据λ值选择相应状态st,即λ∈{s|s=θ1,θ2,θ3},其中θ1=[0.9,1],θ2=[0.5,0.9),θ3=[0,0.5)为状态空间的区间阈值;
步骤6、生成随机数r(r∈[0,1]),基于公式(8)所计算的强化概率ε得到下一步执行动作χt;当r<ε时,选择状态st对应Q值最高的动作;否则,随机选择状态st对应某一动作进行操作;
公式(8)中,maxT为设定的最大迭代次数;
步骤7、针对当前动作χt执行结果对其效用进行评价以引导超启发式算法的搜索方向,定义执行动作χt的效用值函数rt为:
根据公式(10)所示学习函数更新χt所属动作集中所有动作χ′t的Q值,并依据状态表达机制确定下一状态;
公式(10)中Qt(st,χt)表示第t次迭代时状态st对应动作χt的Q值,α为学习率,γ为折扣因子,其中γ=0.8,α采用公式(11)所示方式进行自适应调整;
步骤8、判断t≤maxT是否成立,若成立转到步骤4继续执行,否则输出最优调度方案及其对应的甘特图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江财经大学,未经浙江财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010299221.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理