[发明专利]一种由计算机实现的自适应选择动态生产调度控制系统无效
申请号: | 200710192015.2 | 申请日: | 2007-12-28 |
公开(公告)号: | CN101216710A | 公开(公告)日: | 2008-07-09 |
发明(设计)人: | 严洪森;杨宏兵 | 申请(专利权)人: | 东南大学 |
主分类号: | G05B19/418 | 分类号: | G05B19/418 |
代理公司: | 南京经纬专利商标代理有限公司 | 代理人: | 奚幼坚 |
地址: | 21009*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算机 实现 自适应 选择 动态 生产 调度 控制系统 | ||
1.一种由计算机实现的自适应选择动态生产调度控制系统,其特征在于:设置包括系统仿真器、学习器、决策器、调度规则库、调度知识库、搬运小车、加工设备及其缓冲站,缓冲站设有光栅、传感器以及检测设备,工件到达缓冲站并被加工时,学习器检测当前系统状态进行学习,获取系统的动态调度知识,进而对调度知识库里的知识进行更新,当某加工设备需要调度时,决策器将根据检测到的系统状态,读取调度知识库中对应的调度知识,通过不断地与加工系统交互学习而获取新的调度知识,面向系统中加工设备及工件的状态来动态选取调度规则,选择最优的调度规则对该加工设备进行调度。
2.根据权利要求1所述由计算机实现的自适应选择动态生产调度控制系统,其特征在于通过建立调度优化目标函数,选取系统的状态特征,在定义系统的评估函数及聚类状态基础上,采用基本顺序算法方案BSAS对系统仿真器产生的状态进行聚类,得到系统的聚类状态,通过B-Q学习方法的迭代学习模型对评估函数进行迭代,根据得到的评估函数值选取最优的调度规则对缓冲站中的工件进行实时调度。
3.根据权利要求2所述由计算机实现的自适应选择动态生产调度控制系统,其特征在于,按如下步骤对加工设备缓冲站中的工件队列进行动态调度:
(1)按下列公式分别对平均交货因子f、系统利用率μ、相对机器负载ω和平均松弛时间ζ赋值,并把这些赋值保存在计算机中:
f=∑fj/Nd
μ=Nb/Nm
ζ=(∑ζj)/Nd
(2)学习器通过基本顺序算法方案BSAS得到系统的聚类状态shc,赋初始值给评估函数Q0(snc,av),置循环次数n=1,并存储到计算机中,决策器任意选择调度规则库中的调度规则对空闲加工设备缓冲站中的工件队列进行调度;
(3)学习器检测系统当前时刻t的状态st,通过计算不相似性测度d(st,Cl)并按照
(4)决策器根据ε-greedy法选择调度规则av对加工设备缓冲站中的工件队列进行调度;
(5)决策器检测并判断工件是否已经加工完毕,若还有待加工工件,则学习器观察t+1时刻制造系统的状态st+1,计算不相似性测度得到当前系统聚类状态st+1c,此时学习器会接受到一个立即回报值rt+1,调用B-Q学习迭代模型公式计算评估函数Qn(stc,at)值并存储在计算机中,学习器用学习到的新调度知识对调度知识库里面的知识进行更新;若工件已经加工完毕,则转入步骤(10);
(6)学习器用聚类状态st+1c替换stc,并更新循环次数:n=n+1;
(7)学习器判断所有评估函数是否已经是最优评估函数Q*(Snc,av),若还有评估函数未达到最优,则转入步骤(4);
(8)调度决策模块检测系统当前状态,决策器调用知识库中的对应调度知识对加工设备缓冲站中的工件进行调度;
(9)判断制造系统中所有工件是否都已加工完毕,若还有剩余未加工工件,转步骤(8);否则转步骤(10);
(10)结束整个生产调度过程。
4.根据权利要求2或3所述由计算机实现的自适应选择动态生产调度控制系统,其特征在于:为有效地减小学习过程中Q(stc,at)的波动,有利于提高学习效果。所述的学习器在B-Q学习过程中引入了评估函数阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710192015.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于车辆驱动系统的控制装置
- 下一篇:光学层压体和使用其的液晶面板