[发明专利]一种基于深度强化学习的运载火箭垂直回收智能控制方法有效
申请号: | 201811393548.1 | 申请日: | 2018-11-21 |
公开(公告)号: | CN109343341B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 郜诗佳;谭浪;王德意;柳嘉润;李博睿;巩庆海;杨业;姬晓琴;翟雯婧 | 申请(专利权)人: | 北京航天自动控制研究所;中国运载火箭技术研究院 |
主分类号: | G05B13/02 | 分类号: | G05B13/02;G05B13/04;G05D1/08;G05D1/10 |
代理公司: | 中国航天科技专利中心 11009 | 代理人: | 马全亮 |
地址: | 100854 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于深度强化学习的运载火箭垂直回收智能控制方法,研究实现运载火箭自主智能控制的方法。主要研究解决利用智能控制实现运载火箭垂直回收姿态控制和轨迹规划问题。对航天事业而言,无论在人工成本的节约上,还是在人工失误的减少上,航天器自主智能化无疑都是具有重大意义的。建立运载火箭垂直回收仿真模型,并建立相应的马尔科夫决策过程,包括状态空间、动作空间、状态转移方程、回报函数,使用神经网络拟合环境和智能体行为间的映射关系,并对其进行训练,使得运载火箭能够使用训练好的神经网络自主可控回收。本项目不仅能为航天飞行器轨道智能规划技术提供技术支撑,同时也能为基于深度强化学习的航天飞行器间攻防对抗提供仿真验证平台。 | ||
搜索关键词: | 一种 基于 深度 强化 学习 运载火箭 垂直 回收 智能 控制 方法 | ||
【主权项】:
1.一种基于深度强化学习的运载火箭垂直回收方法,其特征在于步骤如下:(1)搭建运载火箭垂直回收仿真模型;(2)基于仿真模型,建立马尔科夫决策过程,包括状态空间、动作空间、状态转移方程以及回报函数;(3)根据深度强化学习算法,搭建神经网络;(4)基于所述运载火箭垂直回收仿真模型、状态空间、动作空间、状态转移方程以及回报函数,对所述神经网络进行训练,得到训练好的神经网络模型;(5)调用训练好的神经网络模型进行仿真验证;(6)根据仿真验证后的神经网络模型控制运载火箭实现垂直回收。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天自动控制研究所;中国运载火箭技术研究院,未经北京航天自动控制研究所;中国运载火箭技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811393548.1/,转载请声明来源钻瓜专利网。