[发明专利]一种基于深度强化学习和导航向量场的卫星规避拦截方法在审
申请号: | 202211231304.X | 申请日: | 2022-10-09 |
公开(公告)号: | CN115659788A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 王宏伦;张云飞;张梦华;刘一恒;李克行;吴健发 | 申请(专利权)人: | 北京航空航天大学;北京控制工程研究所 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F17/11;G06F17/16;G06N3/092;G06F113/08 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 易卜 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 强化 学习 导航 向量 卫星 规避 拦截 方法 | ||
本发明公开了一种基于深度强化学习和导航向量场的卫星规避拦截方法,属于飞行器导航、制导与控制领域;具体为:首先,建立目标卫星的轨道坐标系和轨道椭圆方程;并设计Lyapunov函数,计算轨道坐标系的期望速度矢量vd作为Lyapunov导航向量场;然后,针对空间中存在的K个拦截卫星,利用扰动流体动态系统算法计算扰动矩阵,利用扰动矩阵修正初始的Lyapunov导航向量场,获得轨道坐标系下的期望速度最后,设计卫星规避拦截的深度强化学习模型,并输入近端策略梯度算法中,用于训练策略网络;使得目标卫星达到期望位置,完成对拦截卫星的规避。本发明使得卫星完成拦截规避后能够快速、平滑地回到预定轨道。
技术领域
本发明属于飞行器导航、制导与控制领域,具体涉及一种基于深度强化学习和导航向量场的卫星规避拦截方法。
背景技术
自20世纪50年代以来,航空航天技术的飞速发展将人类带入了一个新的太空时代。此外,世界各国越来越重视空间资源的军事价值。随着自主交会和对接技术的发展,攻击航天器(或跟踪航天器)通过交会接近目标航天器并实施干扰或打击,已成为一种重要的空间攻击方法。因此,如何实现拦截航天器的在轨博弈规避是一个值得研究的问题。
卫星博弈规避的轨迹规划方法往往需要包括两部分:一部分是遭遇拦截卫星时的规避算法,可以保证卫星以合理的方向和速度避开拦截卫星;另一部分是规避后返回原轨道的趋近律,以保证卫星仍旧能够返回原始轨道。
碰撞概率分析法和人工势场法是解决相关问题的较为常用方法;碰撞概率分析法是借助高精度轨道预测信息,通过分析计算两星的碰撞概率,对航天器碰撞风险进行评估;人工势场方法的核心思想是在空间中引入势场,任意一点均处在势场的作用范围内,势场的负梯度方向即为移动方向,轨迹向着减小势函数的方向移动。
然而,无论是碰撞概率分析法抑或是人工势场法都难以实现复杂场景下的卫星规避拦截。这些算法对于不同场景的鲁棒性不高,当拦截卫星的拦截半径和拦截速度变化较大时卫星难以完成规避,究其原因是没有将拦截卫星的状态信息完全考虑进规避算法之中。
传统算法在特定场景下经过精细参数调整虽然可以实现较好的规避,但并不能做到全场景规避,这也是该领域面对的挑战性难题。除此之外,使用人工势场方法还存在诸多缺点,例如局部最优点等亟待解决问题。
另外,如何使卫星规避轨迹更加平滑且易跟踪也是需要考虑的。
发明内容
本发明为了突破现有算法对不同场景下卫星规避拦截的瓶颈,以及无法将拦截卫星状态信息较好地融入规避算法等缺点,结合新一代人工智能的最新研究成果,提出了一种基于深度强化学习和导航向量场的卫星规避拦截方法;具体包括如下步骤:
步骤一、建立目标卫星的轨道坐标系OeXTYTZT和轨道椭圆方程;
轨道坐标系OeXTYTZT以地球中心为原点,YT指向轨道的近地点,XT位于轨道平面内,垂直于YT轴并指向目标卫星的运行方向,ZT轴与OeXTYT平面形成右手直角坐标系。
轨道椭圆方程如下:
其中,a为轨道半长轴,c=ae,e为偏心率。
步骤二、根据轨道椭圆方程设计Lyapunov函数,并计算轨道坐标系的期望速度矢量vd作为Lyapunov导航向量场;
Lyapunov函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;北京控制工程研究所,未经北京航空航天大学;北京控制工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211231304.X/2.html,转载请声明来源钻瓜专利网。