[发明专利]基于深度强化学习的动态试飞任务规划方法在审
申请号: | 202211617626.8 | 申请日: | 2022-12-15 |
公开(公告)号: | CN115983566A | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 肖刚;田蓓;沈玙 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06Q10/0631 | 分类号: | G06Q10/0631;G06Q10/04 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 强化 学习 动态 试飞 任务 规划 方法 | ||
1.一种基于深度强化学习的动态试飞任务规划方法,其特征在于,以同时最小化试飞周期和任务延期度为目标,构建试飞任务规划问题模型以及试飞任务选择规则和驾机安排的启发式规则;定义包括试验驾机特征信息、系统特征信息和未完成任务特征信息的试飞任务规划环境的状态信息以及基于规划目标的奖励函数;通过建立基于决策-评价的近端策略优化(PPO)模型,利用训练数据对优化模型进行训练后,在线动态规划试飞任务。
2.根据权利要求1所述的基于深度强化学习的动态试飞任务规划方法,其特征是,所述的试飞任务规划问题模型是指:针对m架试验机AC={AC1,AC2,...,ACm},n个试飞任务T={T1,T2,...,Tn},其中:每一个试飞任务Ti只能在一组特定试飞机的集合上且必须在其前置试飞任务完成后进行试飞,TPi为任务Ti的前置任务集合;任务Ti的到位时间和预计完成时间分别为和预计试飞时长为ti;试验机ACk在部署时间ak后投入使用;
所述的试飞任务,受到以下动态事件影响而更新,包括:
1)任务的试飞时长改变:随着试飞试验的进行,一些任务的试飞时长可能会由于初始评估不准确或技术/人为因素而发生变化;
2)无效的任务测试结果:任务测试结果无法确认,无效的任务将不会从未完成的飞行任务集中删除;
3)飞机停飞:飞机故障或支持设备故障将导致飞机停飞以进行维修。
3.根据权利要求1所述的基于深度强化学习的动态试飞任务规划方法,其特征是,所述的试飞任务选择规则包括:
1)选择具有最早完成时间最小值的任务:对于任务Ti的最早完成时间为:其中:ak表示驾机k的部署时间;ck,end为驾机k的结束时间;为任务Ti的前置任务完成的最大时间;为任务Ti的准备就绪时间;ti表示任务任务Ti的试飞执行时间;
2)选择前向等级和最早开始时间之和最小的任务:对于任务Ti的的前向等级为:其中:succ(Ti)表示任务Ti的直接后续任务节点集合;
3)选择具有后向等级最小值的任务:对于任务Ti的的后向等级为:其中:pred(Ti)是任务Ti的直接前置任务集合;ACi为任务Ti的兼容驾机集合;
4)选择前向等级和后向等级之和最小的任务;
所述的驾机安排的启发式规则包括:
a)选择具有最早空闲时间的驾机;
b1选择驾机利用率最小的驾机:驾机k在时刻t的利用率为:其中:n为所要安排的任务数量;FTD(t)表示时刻t的最大任务完成时间;Xik为一个二元变量,如果任务Ti被分配到驾机k上,则值为1,否则为0;
c)随机选择可兼容的驾机。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211617626.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低镜面数环形菲涅尔高匀光性系统
- 下一篇:农用田间除草剂组合物及其应用
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理