[发明专利]一种基于强化学习的多水下机器人编队控制方法在审

专利信息
申请号: 201910274101.0 申请日: 2019-04-08
公开(公告)号: CN109947131A 公开(公告)日: 2019-06-28
发明(设计)人: 闫敬;李鑫;杨晛;公雅迪;罗小元 申请(专利权)人: 燕山大学
主分类号: G05D1/10 分类号: G05D1/10
代理公司: 北京挺立专利事务所(普通合伙) 11265 代理人: 刘阳
地址: 066004 河北省*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于强化学习的多水下机器人编队控制方法,涉及水下机器人控制领域。本发明中,水下机器人编队中的各机器人节点获取自身位置后,控制中心给出虚拟领导者的轨迹信息,并发送至虚拟领导者的邻居节点;水下机器人节点之间建立拓扑通信网络,每个水下机器人节点只和邻居节点进行通信保持编队稳定;水下机器人编队使用当前控制策略追踪轨迹,每个节点通过和环境以及邻居节点进行交互计算一步代价函数,通过令价值函数最小改进当前的控制策略,在价值迭代和策略改进两个步骤都达到收敛时,水下机器人追踪期望轨迹的控制策略达到最优,使用最优控制策略达到准确追踪的目标。
搜索关键词: 水下机器人 控制策略 邻居节点 多水下机器人 强化学习 追踪 虚拟 机器人节点 策略改进 代价函数 轨迹信息 价值函数 交互计算 控制中心 期望轨迹 通信保持 通信网络 自身位置 最优控制 迭代 拓扑 收敛 发送 改进
【主权项】:
1.一种基于强化学习的多水下机器人编队控制方法,所述控制方法包括以下步骤:步骤1、将带有定位装置的水下机器人组成水下机器人编队,控制中心将期望轨迹发送至每个水下机器人,定义期望轨迹为虚拟领导者;并在各个水下机器人之间进行组网通信,建立水下机器人编队的拓扑通信结构G=(V,ξ,A);其中,G是各个水下机器人节点组成的带权有向图,V={v1,v2,...,vN}是水下机器人各个节点的集合,ξ={eij=(vi,vj)}∈V×V是有向图的有向边集,A=[aij]代表具有非负邻接元素aij的加权邻接矩阵,且aij≥0;步骤2、水下机器人编队中水下机器人节点vi在时刻t的自身位置为pi(t)=[xi(t),yi(t),zi(t)]T,虚拟领导者位置为pr(t)=[xr(t),yr(t),zr(t)]T令机器人节点vi在时刻t+1的一步代价为其中,代表追踪误差的代价,ui是水下机器人节点vi的控制器输入,uj代表邻居节点对机器人节点vi的输入,Ai,Bi,Ci均为正定矩阵;建立价值函数:Vi(pi(t))=gi(pi(t),ui(t),u(j)(t))+γVi(pi(t+1))式中,γ∈(0,1)是折扣因子;步骤3、令Vi=WiTΦi(pi),使用迭代权重的方法获得控制方法的价值模型:式中,p(t+1)代表时刻t+1的水下机器人状态,为基向量,是基向量中关于水下机器人节点位置的元素,W是权重向量,Wk+1表示水下机器人编队完成一次追踪后进行价值模型的权重更新,通过最小二乘法迭代求解;步骤4、令ui(pi)=UiTσi(pi),其中基函数σi(pi(t))=[κ1,i(pi(t)),κ2,i(pi(t)),...,κL,i(pi(t))],κi(pi(t))是基向量中关于水下机器人节点位置的元素,权重向量U用梯度下降法进行更新,利用最小时的价值函数时对控制策略进行改进,以此得到在追踪过程中最优的控制策略:其中,u(p)是水下机器人进行位置追踪时每个状态下所进行的下一步动作,将h(p)作为最优控制策略;步骤5、利用迭代权重的方法对控制方法的价值模型更新,和控制策略改进两个过程的同时收敛,完成对当前状态下最优控制策略的求解;步骤6、将步骤1中利用定位装置获得的真实位置输入到步骤2中,经过步骤4‑5操作,获取下一步的最优控制策略;重复循环重复步骤6的操作,完成水下机器人的追踪任务。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910274101.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top