[发明专利]一种基于深度强化学习的多星自主任务分配方法在审
申请号: | 202011140091.0 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112270435A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 王云鹏;袁利;朱琦;张聪;张斯航;郝策;孙栋 | 申请(专利权)人: | 北京控制工程研究所 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06N3/04;G06N3/08 |
代理公司: | 中国航天科技专利中心 11009 | 代理人: | 高志瑞 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 强化 学习 自主 任务 分配 方法 | ||
1.一种基于深度强化学习的多星自主任务分配方法,其特征在于,所述方法包括如下步骤:
步骤一:将地球轨道上由N个卫星组成的星群构建为主从结构星群,其中,主星负责接收任务和分配任务,从星接收主星分配的任务并负责执行;
步骤二:根据步骤一中的主从结构星群,地面建立深度强化学习多星任务自主分配模型,其中,深度强化学习多星任务自主分配模型包括5层神经网络;其中,第一层为输入层,第二层和第三层均为卷积层,第四层和第五层均为全连接层,最后一层是输出层;
步骤三:利用地面计算机对步骤二中的深度强化学习多星任务自主分配模型进行训练;
步骤四:将训练成熟的深度强化学习多星任务自主分配模型上传至主从结构星群中的主星,主星利用训练成熟的深度强化学习多星任务自主分配模型对接收到待分配的任务进行分配。
2.根据权利要求1所述的基于深度强化学习的多星自主任务分配方法,其特征在于:在步骤一中,主从结构星群的特征为:
主从结构星群中卫星分为主星和从星,主星通过星间通讯链路与其他卫星快速通信,主星通过星间通讯链路收集从星状态,发布任务;从星通过星间通信链路反馈自身状态,接收任务;
主星接收任务集合为其中MMmax,Mmax为主星一次可分配任务数的上限;其中,m1为待分配任务1,m2为待分配任务2,mM为待分配任务M,M为待分配任务数量;
所有任务存在时序关系,m1最先执行,mM最后执行;
所有任务要求在T时间内执行完毕,T被分为L个最小时间窗口T=T1∪T2∪…∪TL,每个最小时间窗口只能执行一个任务,而且每一任务都在最小时间窗口内执行完毕。
3.根据权利要求2所述的基于深度强化学习的多星自主任务分配方法,其特征在于:在步骤二中,深度强化学习多星任务自主分配模型的输入层为多星系统在当前任务集合下的状态矩阵集合。
4.根据权利要求3所述的基于深度强化学习的多星自主任务分配方法,其特征在于:多星系统在当前任务集合下的状态矩阵集合通过以下步骤得到:
(21)主星将任务发送给所有从星;
(22)从星计算所有任务在所有最小时间窗口的收益,组成收益矩阵;
(23)从星将收益矩阵反馈给主星,主星将收益矩阵重新组合得到每个任务对应的输入状态矩阵;
(24)根据每个任务对应的输入状态矩阵得到多星系统在当前任务集合下的状态矩阵集合X={B1,B2,…,BM}。
5.根据权利要求4所述的基于深度强化学习的多星自主任务分配方法,其特征在于:在步骤二中,卷积层和全连接层均由一组参数向量W=(w1,w2,…,wP)T表示;其中,w1为权值1,w2为权值2,wP为权值P。
6.根据权利要求5所述的基于深度强化学习的多星自主任务分配方法,其特征在于:在步骤二中,深度强化学习多星任务自主分配模型的输出层为二维收益矩阵,其中,二维收益矩阵为:
其中,qi,j表示将任务m1分配给卫星si的时间窗口Tj时的收益,i=1、2、…、N,j=1、2、…、L。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京控制工程研究所,未经北京控制工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011140091.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理