[发明专利]一种复杂生产过程闭环调度优化方法有效
申请号: | 201911343154.X | 申请日: | 2019-12-23 |
公开(公告)号: | CN110989538B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 曹政才;林诚然;胡标 | 申请(专利权)人: | 北京化工大学 |
主分类号: | G05B19/418 | 分类号: | G05B19/418 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100029 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 生产过程 闭环 调度 优化 方法 | ||
本发明公开了一种复杂生产过程闭环调度优化方法,首先采用有向无环图描述带合作加工约束与设备整定时间约束的job‑shop问题;其次,提取共生进化算法种群状态关键特征,离线训练用于自适应调节共生进化算法参数的参数整定模型,利用种群迭代状态信息获取当前种群最优参数,指导算法寻优;最后,结合种群实际迭代情况的反馈信息,在线更新参数整定模型,保持其鲁棒性,实现获取高质量机器分配与工序排序同步优化的目的。利用本发明能够获取解质量良好的调度方案。
技术领域
本发明属于复杂生产过程调度与控制技术领域,涉及一种带合作加工约束和设备整定时间约束的job-shop问题中设备闭环调度方法。
背景技术
近年来由于随着制造水平的不断提高,工序间的先后约束越发复杂,难以用线性先后关系直接描述。合作加工工序约束普遍存在于半导体、印刷、船舶等行业的各环节,同时由于工艺复杂,消耗时间长,常常成为制约整个系统性能的瓶颈工序。因此,实际生产中有效而快速地给出调度决策方案,将会提升系统性能并扩大产能。为合理描述带合作加工约束与整定时间约束这两类存在于job-shop问题中的复杂约束,采用有向无环图技术,以节点与带权有向线条的形式进行描述。为了提高共生进化算法搜索能力,采用强化学习技术构建算法参数整定系统,这样离线训练在线优化的方式,促进了进化算法高质量决策调度方案在实际生产中的应用。
进化算法对参数敏感,传统参数整定方式往往依赖于先验经验。本发明跳出传统思路,利用强化学习中的SARSA(λ)算法,从揭示算法种群本质结构的角度出发,通过与环境交互,自动化、系统化地构建共生进化算法参数整定策略,实现参数整定策略自主涌现,进而提高算法搜索能力。
运用进化算法获取复杂过程最优调度方案中存在如下问题:(1)进化算法对参数敏感,其求解质量的好快与参数的选取是否合适有较大的关系;(2)由于进化算法严重依赖于随机过程,其每次求解的效果参差不一,且与全局最优解的差距难以估计。本发明重点在于通过强化学习技术实现进化算法参数自适应整定,构建算法闭环控制系统,实现平衡其全局搜索与局部搜索的目的。
发明内容
本发明采用的技术方案为一种复杂生产过程闭环调度方法,首先,基于SARSA(λ)算法离线训练算法参数模型;其次,采用一种在异构下最早完工时间规则基础上,改进得到的启发式规则生成共生进化算法初始解;再次,采用共生演化算法进行迭代搜索调度优化方案,每次迭代时,需根据当前种群的状态和离线训练的算法参数模型获取适用于本次迭代的最优算法参数;最后,采用反馈的方式,在线更新算法参数模型,保持参数控制系统鲁棒性,实现算法闭环架构。进而在合理时间范围内机器分配与工序排序同步优化的目的。利用本发明能够快速有效地获取解质量良好的调度方案,不仅降低了最大完工时间指标,而且提高了复杂生产过程制造系统的整体性能。
为了达到上述目的,本发明采用了以下技术方案。
一种用于复杂生产过程的闭环调度方法,其特征在于,该方法包含以下步骤:
步骤1设计复杂生产过程调度方案编解码方案;步骤2基于SARSA(λ)算法离线训练共生进化算法参数模型;步骤3共生演化计算操作;步骤4根据反馈信息在线更新参数模型。上述方法中各个步骤的详细操作过程如下:
步骤1,设计复杂生产过程调度方案编解码方案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京化工大学,未经北京化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911343154.X/2.html,转载请声明来源钻瓜专利网。