[发明专利]一种基于深度学习的机器人避障轨迹规划方法及系统在审
申请号: | 201810863999.0 | 申请日: | 2018-08-01 |
公开(公告)号: | CN109213147A | 公开(公告)日: | 2019-01-15 |
发明(设计)人: | 刘成良;陶建峰;覃程锦;刘宸;方晔阳;虞洁攀 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02;G06F17/50;G06N3/04 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 庄文莉 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 机器人避障 仿真环境 轨迹规划 一维向量 更新 角度拍摄图像 工业机器人 工业自动化 仿真软件 接口调用 卷积运算 输入信息 图像输入 循环执行 自主避障 机械臂 连接层 目标点 特征图 学习 照相机 生产能力 图像 | ||
本发明提供了一种基于深度学习的机器人避障轨迹规划方法及系统,包括:在仿真环境中加入照相机,从多个角度拍摄图像并同时输入到卷积神经网络中;根据输入信息得到机械臂更新角度的信息,通过接口调用仿真软件进行更新,获取姿态;用深度学习进行卷积神经网络训练,输入的图像经过卷积运算后,将得到的特征图变成一个一维向量,将一维向量输入到后续的全连接层中,得到每个动作对应的q值,选择q值最大的动作并更新姿态,将更新姿态传入仿真环境得到新的图像输入,循环执行,直至达到目标点。本发明可实现工业机器人的自主避障,提高工业自动化生产能力。
技术领域
本发明涉及工业自动化领域,具体地,涉及一种基于深度学习的机器人避障轨迹规划方法及系统。
背景技术
在现代化工业生产环境中,越来越多的机器人被引入流水线参与生产制造工作,较为常见的应用场景有机械加工制造、焊接、装配、喷涂、包装等。通过机器人代替人工劳作,可以有效地提高工作效率、提高生产良品率、减少人工成本。
但常见的机器人对工作环境的要求比较高,需要确保在机器人工作范围内没有障碍物阻隔机器人的运动。现有的常见处理方法是在机器人工作区域设置保护围栏,但该方法一定程度上降低了工厂生产的空间利用率,且对于复杂的生产环境中临时突发的障碍物不具有适用意义。如何实现机器人的自主避障,是提高工业自动化生产能力的关键问题。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于深度学习的机器人避障轨迹规划方法及系统。
根据本发明提供的一种基于深度学习的机器人避障轨迹规划方法,包括:
图像输入步骤:在仿真环境中加入照相机,从多个角度拍摄图像并同时输入到卷积神经网络中;
新姿态获取步骤:根据输入信息得到机械臂更新角度的信息,通过接口调用仿真软件进行更新,获取姿态;
网络训练步骤:用深度学习进行卷积神经网络训练,输入的图像经过卷积运算后,将得到的特征图变成一个一维向量,将一维向量输入到后续的全连接层中,得到每个动作对应的q值,选择q值最大的动作并更新姿态,将更新姿态传入仿真环境得到新的图像输入,循环执行网络训练步骤,直至达到目标点。
较佳的,所述网络训练步骤中,每个动作都会得到一个奖励,奖励分为三部分:
第一部分:每次动作之后都会得到一个负的奖励;
第二部分:每次动作之后都会得到一个负的奖励,在没有触碰到障碍物之前,距离障碍物越近则得到的负的奖励越大,碰到障碍物后则停止循环,并给予一个更大的负的奖励;
第三部分:每次动作之后都会得到一个正的奖励,在没有到达目标点之前,距离目标点越近,则得到的正的奖励越大,在到达目标点之后,得到一个更大的正的奖励并结束此次循环,进行下一次探索。
较佳的,在所述网络训练步骤之后还包括:
经验池采样步骤:所有探索得到的结果都放入经验池中,后续每选择完一个动作都要在经验池中进行采样并使用采样的数据对卷积神经网络进行训练。
较佳的,在所述经验池采样步骤之后还包括:
输出步骤:根据训练好的卷积神经网络输出的最优的路径规划轨迹。
较佳的,在所述图像输入步骤之前还包括:
算法初始化步骤:确定算法的初始条件,并进行算法初始化;
机械臂建模步骤:对算法中使用的机械臂进行建模,将得到的模型导入仿真软件,对各个关节进行约束设置。
根据本发明提供的一种基于深度学习的机器人避障轨迹规划系统,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810863999.0/2.html,转载请声明来源钻瓜专利网。