[发明专利]基于深度强化学习的制造网络维修-检测联合优化方法在审
申请号: | 202310333773.0 | 申请日: | 2023-03-30 |
公开(公告)号: | CN116384969A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 叶正梗;蔡志强;司书宾;王鑫;柯勇伟;李丁林;周福礼 | 申请(专利权)人: | 郑州大学 |
主分类号: | G06Q10/20 | 分类号: | G06Q10/20;G06Q10/0639;G06Q10/04;G06N3/04;G06N3/08 |
代理公司: | 郑州优盾知识产权代理有限公司 41125 | 代理人: | 张彬 |
地址: | 450001 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 强化 学习 制造 网络 维修 检测 联合 优化 方法 | ||
1.一种基于深度强化学习的制造网络维修-检测联合优化方法,其特征在于,其步骤如下:
步骤一:对于机器层面,在考虑机器故障停机导致的动态生产速度的情况下,构建了考虑进料质量影响的机器可靠性模型和考虑机器可靠性影响的加工质量模型;
步骤二:基于可靠性模型和质量模型对制造网络状态和性能进行系统评估;并搭建制造网络维修和质量检测联合优化模型;
步骤三:在系统层面,以制造网络的经济运行作为策略评价的标准,通过设计的一种深度确定性策略梯度算法学习给定制造网络状态下质量检测与维修的最优策略。
2.根据权利要求1所述的基于深度强化学习的制造网络维修-检测联合优化方法,其特征在于,在机器层面,可靠性模型和质量模型的构建方法为:
计算动态生产速度:
将每个机器看作一个节点,利用有向无循环图G(V,E)对n个节点的无循环制造网络进行建模,其中V={v1,v2,…,vn}为制造网络的节点集合,为制造网络中有向边的集合;i、j均为节点;
当制造网络中没有机器故障停机时,将机器的生产速度定义为最大生产速度,表示为Prm=[Prm1,Prm2,…,Prmn];制造网络中机器的实际生产速度记为Pra(t)=[Pra1(t),Pra2(t),…,Pran(t)],且满足Pra≤Prm;其中,Prmn表示第n台机器的最大生产速度,Pran(t)表示第n台机器的实际生产速度;
当节点i的生产速度改变ΔPrai(t)时,其紧邻上游节点的生产速度的变化量ΔPrak(t)和紧邻下游节点的生产速度的变化量ΔPraj(t)分别表示为:
其中,表示与节点i相连的紧邻上游节点集合,表示与节点i相连的紧邻下游节点集合;表示流入节点i的所有在制品中来自上游节点k的概率,表示节点i流出的在制品中流入到下游节点j的概率;
计算动态维修费用:
当考虑生产速度的动态性时,将加工合格进料时的故障率定义为基础故障率rb(t):
rb(t)=(β/α)·(tr/α)β-1;
其中,α是尺度参数,β是形状参数;是以最大生产速度为标准计算的机器的相对运行时间;t为机器运行的实际时间;
考虑到不合格进料可能造成的冲击,实际故障率r(t)定义为:
其中,Δri′为机器不合格进料导致的累积失效率增量,N(t)是机器在[0,t)时间内加工的不合格在制品数量;通过推导得到机器失效的概率分布函数F(t)为:
F(t)=1-exp(-(tr/α)β-∫Δr(t)dt);
其中,为直到t时刻机器加工不合格进料导致的累积失效率增量;Δr(t)的积分的计算公式为:
其中,ti′为第i′个失效率增量的实际发生时刻;
假设机器的纠正性维修和预防性维修的维修时间分别服从以下正态分布:和且μcm≥μpm,纠正性维修和预防性维修的单位时间维修费用分别为ccm和cpm,那么在[0,t)时间内机器的总维修费用cm(t)可表示为:
其中,Ncm(t)为机器在[0,t)时间内的纠正性维修的次数,Npm(t)为机器在[0,t)时间内的预防性维修的次数,tcm_i1为机器第i1次纠正性维修花费的时间,tpm_j1为机器第j1次预防性维修花费的时间;
构建动态加工质量与检测活动模型:
将M(t)定义为[0,t)时间内产生的不合格品数量,M(t)满足强度函数λ(t)的非齐次泊松过程:
λ(t)=ω-ε·e-δ·r(t);
其中,ω0表示最大不合格品产生强度,ε0和δ0均为失效率对强度函数的影响系数,且ω-ελ(t)ωPra(t);定义nd为机器在[t,t+Δt)时间内产生的不合格品数量,其概率为:
其中,为[0,t)时间段内的不合格产品产出的期望值,Δt为质量统计周期;定义nq为机器在[t,t+Δt)时间段内加工的合格产品的总数,表示为:
在检测活动中,对不合格品与合格品的错误判断为:第I类错误,表示错误拒绝,概率为pI;第II类错误,表示错误接受,概率为pII;假设检测活动中的抽样比例为sa,sa∈[0,1],则任意合格在制品发生I类错误的联合概率为sa·pI,任意不合格在制品发生II类错误的联合概率为sa·pII;定义第I类错误和第II类错误的次数分别为nfr和nfa,且分别服从二项分布B(nq,sa·pI)和B(nd,sa·pII);因此,流出机器的不合格在制品数M'(t)是非齐次泊松过程M(t)和二项分布B(nd,sa·pII)的复合,则nfa个不合格在制品在[t,t+Δt)时间段内流出机器的概率为:
其中,m′(t)是[0,t]时间段内流出机器的平均不合格在制品数量;此外,在[t,t+Δt)时间段内合格在制品被拒绝的概率为:
其中,D(t)是累积到时间t时被拒绝的合格在制品,表示从nq个不合格品中随机抽取nfr个样本的可能组合数量;
机器在[t,t+Δt)时间段内加工出的产品被正确判定为不合格品的数量ncr与被正确判定为合格品的数量nca分别表示为:
在此基础上,可以获得机器在[t,t+Δt)时间内通过检测活动判别出的不合格产品比例为:
假设机器检测单个产品的检测费用为cins,则机器在[t,t+Δt)时间内的检测总费用:
假设单个在制品从制造网络输入节点到当前加工节点i的加工过程带来的累计价值增量为vsi,则节点i对应的机器加工单件在制品带来的平均工序价值增量vai可定义为:
其中,vsk表示节点i的上游节点k的累计价值增量;
将检测过程发生II类错误的不合格在制品造成的价值损失定义为因此,机器i在[0,t)时间内加工的所有在制品带来的净价值增量vnet_i为所有正确接受的在制品的价值增量、错误接受的在制品的价值损失与所有被拒绝的在制品的价值损失三个部分之和:
其中,nca_i表示节点i对应的机器正确接受的在制品数量,nfa_i表示节点i对应的机器错误接受的在制品数量,ncr_i表示节点i对应的机器正确拒绝的在制品数量,nfr_i分别表示节点i对应的机器错误拒绝的在制品数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310333773.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理