[发明专利]一种基于预处理层与深度强化学习的机器人导航方法有效
申请号: | 201910037930.7 | 申请日: | 2019-01-15 |
公开(公告)号: | CN109871011B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 许杰雄;于刚;黄思静;张畅;帅凯鹏;蒋境伟 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G05D1/02 | 分类号: | G05D1/02;G05D1/00 |
代理公司: | 深圳市添源知识产权代理事务所(普通合伙) 44451 | 代理人: | 罗志伟 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 预处理 深度 强化 学习 机器人 导航 方法 | ||
1.一种基于预处理层与深度强化学习的机器人导航方法,其特征在于,该方法是在构建的虚拟训练环境中设置虚拟预处理层,在现实环境中设置现实预处理层;
通过现实预处理层与虚拟预处理层输出具有相同意义的信息,将在虚拟训练环境中的深度强化学习结果移植至现实环境中的机器人导航系统上,实现导航;
该方法包括如下步骤:
S100,构建虚拟训练环境;
S200,在构建的虚拟训练环境中进行训练;
S300,构建现实环境;
S400,在现实环境中机器人执行导航过程;
其中,所述步骤S100中构建虚拟训练环境,包括如下步骤:
S101,搭建至少包含导航目标、障碍物以及搭载虚拟传感器的虚拟机器人所在的虚拟环境;
S102,根据虚拟环境中的导航目标和障碍物的场景设计虚拟预处理层,用于提取视野中每个物体的类别信息、占据面积大小信息以及左右位置信息;
S103,根据虚拟预处理层提取并输出的信息结合机器人的运动机构,设计深度强化学习框架;
所述步骤S200在构建的虚拟训练环境中进行训练,是指在构建的虚拟训练环境中,对虚拟机器人模型中的深度强化学习进行训练,输出信息供虚拟机器人执行,其过程包括如下步骤:
S201,虚拟预处理层从虚拟传感器获得的环境图片中提取出每个物体的物体类别、占据面积大小和左右位置的信息,送至深度强化学习;
S202,根据目标与障碍物的面积进行奖励的计算,判断任务完成情况,输出任务完成或任务失败信号,送至深度强化学习;
S203,深度强化学习根据目标与障碍物信息输出动作,供虚拟机器人模型执行以获得奖励信息,并结合奖励信息进行网络调优,从网络输出端到输入端进行梯度反向传播,循环至完成训练。
2.根据权利要求1所述 的基于预处理层与深度强化学习的机器人导航方法,其特征在于,在步骤S300构建现实环境时,构建能提取现实环境图片中物体信息的现实预处理层,并将在虚拟训练环境中训练完成的深度强化学习权重信息移植至现实环境的深度强化学习中,进行调优。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910037930.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于强化学习型的方法及系统
- 下一篇:一种智能割草机在边界处的转向方法