[发明专利]基于Q学习的流程制造车间滚揉结扎工序段生产优化方法在审
申请号: | 202111650352.8 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114281050A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 韩忠华;卞旭升;常大亮 | 申请(专利权)人: | 沈阳建筑大学;中国科学院沈阳自动化研究所 |
主分类号: | G05B19/418 | 分类号: | G05B19/418 |
代理公司: | 沈阳飞扬灵睿知识产权代理事务所(普通合伙) 21255 | 代理人: | 杨乃力 |
地址: | 110000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 流程 制造 车间 结扎 工序 生产 优化 方法 | ||
1.一种基于Q学习的流程制造车间滚揉结扎工序段生产优化方法,其特征在于:包括以下步骤
步骤1、建立流程制造车间滚揉结扎工序段模型,可以对实际的生产车间滚揉结扎工序段情况进行模拟生产;
步骤2 获取流程制造车间的生产数据;
步骤3 定义Q学习参数;
步骤4 初始化Q表,生成记录动作-时间-Q值的自增长式Q表,每当遇到新状态时,将此状态记录在Q表中;
步骤5 根据步骤3所定义的流程制造车间状态S初始化状态并生成其对应的动作、初始化时间t为0;
步骤6 对于当前生产线状态S(t),根据Q表选择滚揉工序开工哪一个工位的回报R高,若在回报的最高值中,存在多个动作A,则在这些动作A构建的动作集合中进行随机选择,得到A(t);
步骤7 通过建立的流程车间模型根据在t时刻时对应的状态S(t)所选的动作A(t)对流程车间环境进行访问,即模拟生产,得到下一个时刻的状态S(t+1);
步骤8 判断滚揉锅的工作状态,若在t+1时刻的状态S(t+1)中,若滚揉锅全为工作状态,则返回至步骤7;若存在空闲的滚揉锅,则跳至步骤9;
步骤9 判断状态S(t+1)是否为终止状态,即滚揉工序的所有设备均达到生产任务量并且滚揉工序的出料仓均无法向结扎工序进行供料,若状态S(t+1)为终止状态,给出步骤3中定义的反馈值R、记录将迭代次数加1并跳至步骤12;若状态S(t+1)不为终止状态,跳至步骤10;
步骤10 判断t+1时刻的流程车间状态S(t+1)在Q表记录的状态中是否存在,若不存在,则将此状态S(t+1)记录在Q表中并存入其对应的动作A(t+1)。若存在,则返回至步骤6;
步骤11 根据步骤7选择的动作A(t)根据S(t+1)找到对应的动作Q值中最大的Q值作为其反馈值R;
步骤12 根据步骤9或步骤11得到的回报R对S(t)选择的动作A(t)对应的Q值进行更新,记录时间t加1,其回报根据下列公式进行回馈更新;
其中,R(S(t),a(t))为当前状态-动作对本身的Q值,为采取动作到达下一个状态时所有动作回报的最高值。若为步骤9跳至此步骤,则跳至步骤13,若为步骤11跳至此步骤,则返回至步骤6;
步骤13 判断迭代次数是否达到预先设定值,若未达到,返回至步骤5,若达到,则将此时的Q表作为Q学习的流程制造车间滚揉结扎工序段生产优化结果输出。
2.根据权利要求1所述的一种基于Q学习的流程制造车间滚揉结扎工序段生产优化方法,其特征在于:所述建立流程制造车间滚揉结扎工序段模型在于模型约束关系,包括工位信息约束、生产关系约束、结扎线工作任务约束及火腿肠剩余数量约束。
3.根据权利要2所述的一种基于Q学习的流程制造车间滚揉结扎工序段生产优化方法,其特征在于:所述工位信息约束,
在滚揉工序中,滚揉锅总数与滚揉出料仓总数相等,并且每个滚揉锅都只对应各自的滚揉锅出料仓。对应关系如下。
PT=MT
其中,式(1)代表滚揉锅总数与滚揉出料仓总数相等。在式(2)中,WST,iCanOutTc表示第i个滚揉锅WST,i是否可以在第c个滚揉出料仓出料。
在结扎工序中,结扎线总数与滚结扎线进料仓总数相等,并且每条结扎线只对应各自的结扎线进料仓。对应关系如下。
ML=PL
其中,式(3)代表结扎线总数与结扎进料仓总数相等。在式(4)中,WST,jCanOutLr表示第j条结扎线WST,j是否可以在第r个结扎进料仓中吸料。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳建筑大学;中国科学院沈阳自动化研究所,未经沈阳建筑大学;中国科学院沈阳自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111650352.8/1.html,转载请声明来源钻瓜专利网。