[发明专利]一种基于改进Q-learning算法的无人机航路规划方法有效
申请号: | 201910632921.2 | 申请日: | 2019-07-15 |
公开(公告)号: | CN110488859B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 富立;李润夏;王玲玲 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G05D1/10 | 分类号: | G05D1/10 |
代理公司: | 北京航智知识产权代理事务所(普通合伙) 11668 | 代理人: | 黄川;史继颖 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于改进Q‑learning算法的无人机航路规划方法,在不同的仿真环境下训练无人机得到先验知识列表,之后在未知的环境中,利用训练得到的先验知识引导无人机进行探索,减少无人机在未知环境下的探索步数;引入单位置动作值函数收敛的准则,改变传统Q‑learning依据马尔科夫过程链式收敛的原则,加快动作值函数的收敛速度。 | ||
搜索关键词: | 一种 基于 改进 learning 算法 无人机 航路 规划 方法 | ||
【主权项】:
1.一种基于改进Q-learning算法的无人机航路规划方法,其特征在于,包括以下步骤:/nS1:利用仿真环境训练无人机以获取先验知识,形成先验知识列表;/nS2:在未知的环境中,设立无人机的起始点和终止点,利用步骤S1获取的先验知识引导无人机进行探索;/nS3:判断每个位置的动作值函数是否收敛,若收敛,计算该位置的动作值函数,并停止更新该位置的动作值函数;若不收敛,更新该位置的动作值函数;/nS4:判断是否所有位置的动作值函数都已收敛,若收敛,结束探索过程,根据动作值函数确定出最优航路方案;若不收敛,则无人机继续从起始点开始探索,进行下一次迭代,重复执行步骤S2和步骤S3,直到所有位置的动作值函数全部收敛。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910632921.2/,转载请声明来源钻瓜专利网。