[发明专利]一种基于深度强化学习的两目标单机批调度方法有效
申请号: | 202110837216.3 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113515097B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 谭琦;余荣坤;孙晨皓;唐昊;余佩遥 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G05B19/418 | 分类号: | G05B19/418 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于深度强化学习的两目标批调度方法,包括:1、给出两目标单机批调度问题模型;2、利用加权和策略将两目标单机批调度模型分解为T+1个单目标模型,并采用对分查找和二叉搜索树的思想对单目标模型的权重值进行划分,得到T+1个单目标模型的目标函数;3、采用指针网络作为单目标模型的策略网络,采用多头注意力和卷积层作为单目标模型的评价网络,以构建深度学习的网络模型;4、根据单目标模型的目标函数,采用actor‑critic算法对网络模型进行训练,得到训练后的网络模型。本发明通过两目标的分解和权值的划分,结合深度强化学习决策方法来得到调度方案,从而能提高机器的生产效率,减少运行成本和决策时间。 | ||
搜索关键词: | 一种 基于 深度 强化 学习 目标 单机 调度 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110837216.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种自动搭扣模箱
- 下一篇:一种基于互联网的车载音响及其使用方法