[发明专利]智能水下机器人垂直面路径跟随的深度强化学习控制方法有效
申请号: | 201910514354.0 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110209152B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 李晔;白德乾;姜言清;安力;武皓微 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G05D1/00 | 分类号: | G05D1/00;G05D1/12;G06N7/00;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供的是一种智能水下机器人垂直面路径跟随的深度强化学习控制方法。步骤一,根据智能水下机器人的路径跟随控制要求,建立与代理人进行交互的智能水下机器人环境;步骤二,建立代理人集合;步骤三,建立经验缓存池;步骤四,建立学习者;步骤五,使用分布式确定性策略梯度进行智能水下机器人路径跟随控制。本发明针对智能水下机器人所处海洋环境复杂多变,传统控制方法无法与环境主动进行交互的现象,设计智能水下机器人垂直面路径跟随的深度强化学习控制方法。使用确定性策略梯度通过分布式的方法来完成智能水下机器人的路径跟随控制任务,具有自学习,精度高,适应性好,学习过程稳定的优点。 | ||
搜索关键词: | 智能 水下 机器人 垂直面 路径 跟随 深度 强化 学习 控制 方法 | ||
【主权项】:
1.一种智能水下机器人垂直面路径跟随的深度强化学习控制方法,其特征是:步骤一,根据智能水下机器人的路径跟随控制要求,建立与代理人进行交互的智能水下机器人环境;步骤二,建立代理人集合;步骤三,建立经验缓存池;步骤四,建立学习者;步骤五,使用分布式确定性策略梯度进行智能水下机器人路径跟随控制。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910514354.0/,转载请声明来源钻瓜专利网。