[发明专利]一种基于奖励重塑强化学习的飞行器智能引导方法有效
申请号: | 201911307975.8 | 申请日: | 2019-12-18 |
公开(公告)号: | CN111026157B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 李辉;王壮;陈希亮;吴昭欣;吴昊霖 | 申请(专利权)人: | 四川大学 |
主分类号: | G05D1/10 | 分类号: | G05D1/10 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于奖励重塑强化学习的飞行器智能引导方法,包括下述步骤:首先设置使用空域范围,以及飞行器和目的地的动态模型;然后,构建深度强化学习智能体,并重塑奖励函数,包括终止条件奖励、引导平滑性奖励、飞行器姿态奖励;之后,在训练模式下,设置飞行器初始姿态,目的地初始位置、朝向,并使用强化学习方法训练引导智能体;最后,在应用模式下,使用训练完成的引导智能体,引导飞行器沿着特定方向到达移动的目的地。本发明的方法可以应用在现有飞行器指挥引导系统中,采用预先规划或实时指挥的方式,引导飞行器从任意姿态开始,沿着特定方向到达移动目的地。 | ||
搜索关键词: | 一种 基于 奖励 重塑 强化 学习 飞行器 智能 引导 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911307975.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种热塑性聚氨酯母粒的切粒装置
- 下一篇:一种环己烯类液晶中间体的提纯方法