[发明专利]一种通过虚拟环境建立自主移动机器人导航系统的方法在审

申请号：	201910072228.4	申请日：	2019-01-25
公开（公告）号：	CN109782600A	公开（公告）日：	2019-05-21
发明（设计）人：	董爱华;石远;张珏;李扬	申请（专利权）人：	东华大学
主分类号：	G05B13/04	分类号：	G05B13/04
代理公司：	上海申汇专利代理有限公司 31001	代理人：	翁若莹;柏子雵
地址：	201600 上***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	导航机器人强化学习虚拟环境移动机器人导航系统未知环境构建自主移动机器人智能导航系统机器人智能神经网络网络参数虚拟移动起止点一站式智能体渐进算法迁移更新
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了基于深度强化学习的导航机器人在未知环境下建立导航的方法。所述方法通过以下方式实现：首先对虚拟环境、虚拟移动机器人智能体状态、起止点信息和行为进行表达，然后构建基于DQN算法的深度强化学习结构，对虚拟环境下移动机器人智能体进行训练，更新DQN网络参数，最后将训练策略通过渐进神经网络迁移，构建移动机器人智能导航系统。本发明提出的基于深度强化学习的导航机器人在未知环境下建立导航的方法不仅具有较好的灵活性和通用性，建立了针对导航机器人建立导航系统的完整的一站式解决方案。

技术领域

本发明涉及一种基于深度强化学习的导航机器人在未知环境建立导航的方法，属于机器人导航避障领域。

背景技术

机器人的智能导航是机器人研究中的一项至关重要的研究内容，是指移动机器人在未知环境中，能通过自主学习自主规划出一条安全快速抵达目的地的无碰路线。

目前基于未知环境的移动机器人的导航一般采用局部路径规划的方法，其方法大部分需要全部或者部分的先验环境知识以及相应的训练数据，因此灵活性不足，无法良好地应对动态场景。

基于部分可观察马尔科夫决策过程建模的强化学习方法采用试错学习的方式进行最优策略的迭代，因此在消耗资源较多的场景中，对数据的利用率很低，损失较大。而在真实环境下往往难以有效地在线获得如此大量的训练数据。

发明内容

本发明的目的是：提供一种基于深度强化学习算法，通过虚拟环境模拟训练自主移动机器人并建立其应用于硬件平台的导航系统的方法。

为了达到上述目的，本发明的技术方案是提供了一种通过虚拟环境建立自主移动机器人导航系统的方法，其特征在于，包括以下步骤：

步骤1、对虚拟环境状态、虚拟移动机器人智能体状态、起始点信息、目标点信息和行为进行表达，构建富环境客户端；

步骤2、构建深度强化学习结构，通过服务器端-富环境客户端的交互方式完成对虚拟环境下移动机器人智能体的训练，获取最优策略，深度强化学习结构的输入为通过安装在机器人上的摄像头传感器采集到的图像信息，深度强化学习结构的输出为移动机器人的控制行为；

步骤3、将训练得到的最优策略通过迁移学习构建真实环境移动机器人智能导航系统。