[发明专利]一种智能环境下机器人运动路径深度学习控制规划方法有效
申请号: | 201710640558.X | 申请日: | 2017-07-31 |
公开(公告)号: | CN107368076B | 公开(公告)日: | 2018-03-27 |
发明(设计)人: | 刘辉;李燕飞;黄家豪;段超;王孝楠 | 申请(专利权)人: | 中南大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 长沙市融智专利事务所43114 | 代理人: | 龚燕妮 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种智能环境下机器人运动路径深度学习控制规划方法,该方法包括步骤1对运载机器人运载区域构建全局地图三维坐标系,获取在全局地图三维坐标系下的可行走区域坐标;步骤2获取训练样本集;步骤3构建运载机器人的全局静态路径规划模型;步骤4将运输任务中的起点和终点坐标输入至基于模糊神经网络的全局静态路径规划模型,获得对应的运载机器人最优规划路径。本发明通过分别建立全局静态路径规划模型和局部动态避障规划模型,利用深度学习的极强的非线性拟合特性,快速的找到全局最优路径,避免了常见的路径规划中陷入局部最优的问题。 | ||
搜索关键词: | 一种 智能 环境 机器人 运动 路径 深度 学习 控制 规划 方法 | ||
【主权项】:
一种智能环境下机器人运动路径深度学习控制规划方法,其特征在于,包括以下步骤:步骤1:对运载机器人运载区域构建全局地图三维坐标系,获取在全局地图三维坐标系下的可行走区域坐标;运载区域地面中心点为原点,正东方向为X轴,正北方向为Y轴,垂直地面方向为Z轴;所述运载机器人运载区域为一个楼栋内所有的地板连通区域,所述可行走区域是指从所有的地板连通区域中删除楼栋内的障碍物所在区域;步骤2:获取全局训练样本集;在全局地图三维坐标系中,设计至少200组可行走区域中不同的点到点的最优设计全局路径,以每条最优设计全局路径作为一个全局训练样本;步骤3:构建运载机器人的全局静态路径规划模型;利用全局训练样本集中每个全局样本的起点‑终点坐标和对应的最优设计全局路径分别作为输入数据和输出数据,对深度学习DBN网络进行训练,得到基于深度学习DBN网络的全局静态路径规划模型;其中,在全局训练过程中,深度学习DBN网络所使用的BP网络权值采用差分进化狼群算法进行寻优获得;步骤4:分别将运输任务中从初始待命点到取物点,从取物点到放物点,和从放物点到待命点坐标输入至基于深度学习DBN网络的全局静态路径规划模型,获得对应的区间的运载机器人最优全局规划路径;对深度学习DBN网络进行如下训练过程得到基于深度学习DBN网络的全局静态路径规划模型:深度学习DBN模型包括为五层,分别为:一层输入层、三层隐藏层以及一层输出层,其中可视层和第一隐藏层构成第一层限制玻儿兹曼机RBM,第一隐藏层和第二隐藏层构成第二层限制玻儿兹曼机RBM,第二隐藏层和第三隐藏层构成BP网络层;使用逐层训练的方法依次对两层限制玻儿兹曼机RBM和BP网络层进行训练:第一层限制玻儿兹曼机RBM的训练是指,从200组全局训练样本中随机抽取150组训练样本作为第一层限制玻儿兹曼机RBM训练样本,训练完成后得到第一层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;第二层限制玻儿兹曼机RBM的训练是指,使用与第一层限制玻儿兹曼机RBM训练时相同的150组训练样本,以及同样的方法训练第二层限制玻儿兹曼机RBM,得到第二层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;BP网络层的训练是指,使用差分进化狼群算法优化的BP网络对整个DBN模型进行微调,训练样本为剩余的50组训练样本,训练完成后输出整个DBN模型作为全局静态路径规划算法模型;所述基于深度学习DBN网络的全局静态路径规划模型所使用的BP网络权值采用差分进化狼群算法进行寻优获得的过程如下:步骤2.1:以个体狼的位置作为BP网络权值,初始化狼群中的个体狼并设置狼群参数;狼群规模的取值范围为[50,300],步长因子的取值范围为[80,160],探狼比例因子的取值范围为[2,6],最大游走次数的取值范围为[15,30],距离判定因子的取值范围为[50,100],最大奔袭次数的取值范围为[5,15],更新比例因子的取值范围为[2,6],最大迭代次数的取值范围为[500,1000],最大搜索精度的取值范围为[0.001,0.01];步骤2.2:设定适应度函数,并确定初始最优头狼位置和迭代次数t,t=1;将个体狼位置体对应的BP网络权值代入基于深度学习DBN网络的全局静态路径规划模型中,并利用个体狼位置确定的基于深度学习DBN网络的全局静态路径规划模型输出全局训练样本集中每个全局训练样本起点和终点对应的全局规划路径,将所有全局训练样本的规划全局路径和最优设计全局长度作商后,再取均值,作为第一适应度函数F1;其中,M为训练样本数,n为输出的全局规划路径所经历的坐标点的个数,xi,j和xi,j‑1为第i个样本使用该狼确定的深度学习DBN模型得到的路径中第j点和第j‑1点的X轴坐标,类似的,yi,j和yi,j‑1分别为第j点和第j‑1点的Y轴坐标,第j点和第j‑1点为相邻两点,L为人工设置的样本对应最优设计全局路径的长度;步骤2.3:更新狼群,并获得更新后的最优头狼位置;依次对所有个体狼进行游走行为、奔袭行为、围攻行为、变异操作、交叉操作、选择操作;步骤2.4:判断是否达到优化精度要求或t达到最大迭代次数,若达到,输出头狼的位置对应的BP网络的权值,若未达到,令t=t+1,返回步骤2.3。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710640558.X/,转载请声明来源钻瓜专利网。
- 上一篇:带易拆卸锁止机构的插接玩具
- 下一篇:一种卷轴玩具