[发明专利]排产方法、装置、设备及存储介质在审
申请号: | 202310358190.3 | 申请日: | 2023-04-04 |
公开(公告)号: | CN116485119A | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 谢海琴;肖人文 | 申请(专利权)人: | 海尔数字科技(上海)有限公司;卡奥斯物联科技股份有限公司 |
主分类号: | G06Q10/0631 | 分类号: | G06Q10/0631;G06Q50/04;G06N3/092 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 刘臣刚 |
地址: | 200233 上海市徐汇区上海漕河*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方法 装置 设备 存储 介质 | ||
1.一种排产方法,其特征在于,包括:
确定待排产信息;其中,所述待排产信息用于指示待排产设备的信息以及待排产工件的信息;
根据所述待排产信息初始化俄罗斯方块线上环境;
根据预先训练好的排产模型与所述俄罗斯方块线上环境进行交互,得到所述排产模型输出的每个待排产设备的排产计划;其中,所述排产模型为利用深度强化学习方法、以提高设备均衡利用率为指标训练得到的模型,每个待排产设备的排产计划包括所述待排产设备对应的待排产工件的信息以及各待排产工件的加工顺序。
2.根据权利要求1所述的方法,其特征在于,所述根据预先训练好的排产模型与所述俄罗斯方块线上环境进行交互,得到所述排产模型输出的每个待排产设备的排产计划,包括:
获取所述俄罗斯方块线上环境根据所述待排产信息输出的中间状态信息;
向所述排产模型输入所述中间状态信息,获取所述排产模型根据所述中间状态信息生成的策略动作,向所述俄罗斯方块线上环境反馈所述策略动作,获取所述俄罗斯方块线上环境根据所述策略动作输出的新的中间状态信息,重复执行此步骤,直至所有待排产工件均被排产,根据所述排产模型输出的策略动作确定每个待排产设备的排产计划。
3.根据权利要求2所述的方法,其特征在于,所述中间状态信息包括:当前已排产工件的类型、当前已排产工件的位置、各待排产设备的负荷、当前未排产工件的信息以及当前上一个动作的信息;
所述策略动作包括:选取的未完成排产的工件的标识以及所述未完成排产的工件对应的待排产设备的标识。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述待排产设备的信息包括所述待排产设备的数量和类型,所述待排产工件的信息包括所述待排产工件的数量和类型;
所述待排产信息还包括:待排产设备与待排产工件的映射关系。
5.根据权利要求1至3任一项所述的方法,其特征在于,当两个加工顺序相邻的待排产工件的类型不同时,所述排产计划还包括:所述两个加工顺序相邻的待排产工件之间的换型操作。
6.根据权利要求1至3任一项所述的方法,其特征在于,在所述根据预先训练好的排产模型与所述俄罗斯方块线上环境进行交互,得到所述排产模型输出的每个待排产设备的排产计划之前,所述方法还包括:
根据训练用排产信息,初始化俄罗斯方块训练环境;
获取所述俄罗斯方块训练环境根据所述训练用排产信息输出的新训练中间状态信息;
向训练排产模型输入所述新训练中间状态信息,获取随机生成的训练策略动作或者获取所述训练排产模型根据所述新训练中间状态信息生成的训练策略动作,向所述俄罗斯方块训练环境反馈所述训练策略动作,获取所述俄罗斯方块训练环境根据所述训练策略动作输出的更新的新训练中间状态信息,所述训练排产模型根据所述俄罗斯方块训练环境输出的训练中间特征,采用随机梯度下降算法以设定的频率更新,重复执行此步骤,直至所述训练排产模型满足预设设计要求,将满足预设设计要求时的训练排产模型作为所述排产模型;
其中,所述训练中间特征包括:新训练中间状态信息、老训练中间状态信息、奖励值以及当前动作策略,所述奖励值根据设备均衡利用率确定。
7.根据权利要求6所述的方法,其特征在于,所述奖励值根据如下方式计算:
在当前动作策略之前的设备均衡利用率U1大于当前动作策略之后的设备均衡利用率U2时,所述奖励值为第一值;其中,U1=(老训练中间状态的换型次数*老训练中间状态的设备负荷差)/老训练中间状态下已排产工件数,U2=(新训练中间状态的换型次数*新训练中间状态的设备负荷差)/新训练中间状态下已排产工件数;
在U1等于U2时,所述奖励值为第二值;
在U1小于U2时,所述奖励值为第三值;
其中,所述第一值、第二值与第三值的大小关系为:第一值第二值第三值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海尔数字科技(上海)有限公司;卡奥斯物联科技股份有限公司,未经海尔数字科技(上海)有限公司;卡奥斯物联科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310358190.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理