[发明专利]一种基于模仿学习的深海精细遥操纵任务的实现方法在审
申请号: | 202110430739.6 | 申请日: | 2021-04-21 |
公开(公告)号: | CN113119132A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 李铁风;范耀威 | 申请(专利权)人: | 浙江大学 |
主分类号: | B25J9/22 | 分类号: | B25J9/22 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 孙永智 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模仿 学习 深海 精细 操纵 任务 实现 方法 | ||
1.一种基于模仿学习的深海精细遥操纵任务的实现方法,其特征在于,
包括以下步骤,
步骤S1:搭建目标任务的MuJoCo仿真环境,包括机械臂等执行机构和操纵对象;
步骤S2:操作员在步骤S1搭建的仿真环境中操纵机械臂来完成目标任务,由软件记录机械臂各关节的运动序列,为步骤S4的仿真训练提供示教范例;
步骤S3:采用Actor-Critic框架构建网络,策略网络的观测输入包括机械臂本体运动、力反馈、视觉等信息,策略网络的输出为机械臂各个关节的关节位置指令;
步骤S4:以步骤S2中的示教范例为模仿对象,应用不基于模型的强化学习算法对网络进行训练,使仿真环境中的机械臂能以99%以上的成功率完成目标任务。
步骤S5,将训练好的策略网络迁移到实际场景中,无需人工干预即可完成目标任务。
2.根据权利要求1所述的一种基于模仿学习的深海精细遥操纵任务的实现方法,其特征在于所述步骤S1还包括在仿真环境中添加所述噪声参数,所述噪声参数添加到机械臂各关节位置。
3.一种基于模仿学习的深海精细遥操纵任务的实现方法的应用,其特征在于,所述应用包括深海探测或水下作业。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110430739.6/1.html,转载请声明来源钻瓜专利网。