[发明专利]一种适用于多种复杂路径的移动机器人循线系统有效
申请号: | 202110522424.4 | 申请日: | 2021-05-13 |
公开(公告)号: | CN113359703B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 徐思宇;阮雨迪;樊越海;禹鑫燚;欧林林 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 多种 复杂 路径 移动 机器人 系统 | ||
1.一种适用于多种复杂路径的移动机器人循线系统,其特征在于:包括仿真训练模块,动作策略模块、PID控制器模块、图像处理模块,机器人I/O模块,机器人模块和RGB彩色相机;其中动作策略模块、PID控制器模块、图像处理模块安装在嵌入式开发板上;嵌入式开发板和彩色相机通过USB与移动机器人连接;彩色相机获取彩色RGB图;嵌入式开发板发送运动指令控制移动机器人;移动机器人执行动作,进行循线;
仿真训练模块,采用机器人仿真软件搭建仿真环境,然后在该仿真环境下对移动机器人进行循线任务的训练,并保存最后训练结束得到的网络参数模型;图像处理模块,接收彩色相机发送的RGB图像,对图像进行处理之后得到图像中当前移动机器人的中心线与所要跟随的路径中心线之间的误差e、当前移动机器人的曲率与所要跟随的路径曲率之间的误差ec,和将要跟随的路径上的五个点其中i∈{1,2,3,4,5};动作策略模块,导入训练后的网络参数模型,并接收图像处理模块所发送的路径信息当前移动机器人的中心线与所要跟随的路径中心线之间的误差e和机器人I/O模块发送的当前机器人的运动信息与位姿信息,得到最优PID控制器参数和移动机器人当前所需线速度vt;PID控制器模块,接收图像处理模块发送的路径跟踪误差e和ec,接收动作策略模块发送的最优PID参数,计算得到移动机器人所需角速度的增量△ω;机器人I/O模块,接收动作策略模块和PID控制器模块发送的机器人当前时刻t运动指令,即线速度vt和角速度ωt,并将运动指令发送给机器人模块;机器人模块,接收运动指令,控制移动机器人进行循线运动,并实时反馈移动机器人运动、位姿信息和彩色相机图像信息给机器人I/O模块;
仿真训练模块包括:利用机器人仿真平台ROS构建带RGB相机的移动机器人仿真模型,在仿真软件Gazebo中搭建可视化仿真环境,并将移动机器人仿真模型映射到可视化仿真环境中;通过RGB相机采集轨迹图像信息,对图像进行处理之后得到图像中当前移动机器人的中心线与所要跟随的路径中心线之间的误差e、当前移动机器人的曲率与所要跟随的路径曲率之间的误差ec,和将要跟随的路径上的五个点其中i∈{1,2,3,4,5};通过仿真的Gazebo环境插件获取移动机器人的线速度vt和角速度ωt,结合路径和误差信息构成机器人当前的状态,st=[x1,y1,x2,y2,x3,y3,x4,y4,x5,y5,ec,vt,ωt];基于SAC-PID方法,对循迹机器人进行仿真训练,包括以下步骤:
(1)初始化两个相同的动作价值网络Q(θi),i∈{1,2},状态价值网络V(ψ)和策略网络π(φ),其中φ,ψ,θi分别为策略网络,状态价值函数网络和动作价值函数网络的参数;初始化经验回放池R,设定训练回合数N;
(2)状态st输入策略网络π(φ),输出六维PID控制参数Kt给双增量式PID控制器,PID控制器输出角速度指令,根据偏差的绝对值输出线速度指令;移动机器人执行动作后,计算奖励r,获取新的状态st+1和回合结束标志F,将(st,Kt,rt,st+1,F)存入经验回放池R中;
(3)基于深度强化学习SAC算法,从经验回放池R中随机抽取d个数组利用随机梯度下降算法更新网络模型的参数,若len(R)d,则跳过这一步骤;
(4)当机器人完成循迹任务或者离开轨迹时进入下一个训练回合,直到机器人完成给定的回合数N,结束仿真训练,将训练好的网络模型保存在PC中;
图像处理模块包括:从彩色相机获取RGB彩色图像,将其转换为HSV图像并进行二值化,得到二值图Ifront;利用透视变换获得二值图Ifront的俯视图Itop;对二值图Ifront和俯视二值图Itop,分别从图像最下方进行逐行搜索直至得到黑色路径在白色背景下的左右边界点及其中点(xfront,yfront)和(xtop,ytop),其中将xfront归一化就是当前移动机器人的中心线与所要跟随的路径中心线之间的误差e;对二值图Ifront和俯视二值图Itop,分别将点(xfront,yfront)和(xtop,ytop)作为种子点,利用向上的区域生长法获得各自的二维列表形式的区域生长结果Lfront和Ltop,其中列表Lfront和Ltop存储的是图像中代表路径的黑色像素点的坐标;从列表Lfront取出纵坐标分别是最小值、最大值、最大值、最大值和最大值的五个黑色像素点的坐标,并将其归一化为其中i∈{1,2,3,4,5},作为将要跟随的路径上的五个点;从列表Ltop取出纵坐标分别是最大、最小和最大值的三个黑色像素点的坐标其中i∈{1,2,3},然后利用三点法获得所要跟随的路径曲率之间的误差,再与当前移动机器人的曲率相比较,获得曲率误差ec;
动作策略模块包括:导入仿真训练后的策略网络模型,并接收图像处理模块所发送的路径信息当前移动机器人的中心线与所要跟随的路径中心线之间的误差e、当前移动机器人的曲率与所要跟随的路径曲率之间的误差ec和机器人I/O模块发送的当前机器人的运动信息与位姿信息;如果机器人离开路线或完成一次循线任务后回到原点,就发送给移动机器人的线速度v=0;否则,根据策略网络计算最优PID控制器参数{kp,ki,kd,kpc,kic,kdc},其中{kp,ki,kd}是主要PID控制器的比例、积分和微分参数,{kpc,kic,kdc}是辅助PID控制器的比例、积分和微分参数;并根据当前移动机器人的中心线与所要跟随的路径中心线之间的误差e计算移动机器人所需线速度v,如公式(1)所示,其中|e(t)|∈[0,1],且a和b是用来限制移动机器人的线速度的正实数;因此最终发送给移动机器人的线速度v范围为[b,b-a],其中要求a≥0;
v=-a|e(t)|+b (1)
PID控制器模块包括:从图像处理模块接收路径跟踪误差e和ec,从动作策略模块接收最优PID控制器参数{kp,ki,kd,kpc,kic,kdc};根据公式(2),计算出主要PID控制器的输出△ωm,其中e(t)、e(t-1)和e(t-2)分别是t,t-1和t-2时刻的误差e的数值;根据公式(3),计算出辅助PID控制器的输出△ωc,其中ec(t),ec(t-1)和ec(t-2)分别是t,t-1和t-2时刻的ec;根据公式(4),计算出移动机器人的角速度的增量△ω,其中η∈[0,1]是辅助PID控制器所占的权重系数;
△ωc=kpc[ec(t)-ec(t-1)]+kicec(t)+kdc[ec(t)-2ec(t-1)+ec(t-2)] (3)
△ω=△ωm+η△ωc (4)
ωt=ωt-1+△ωm+η△ωc (5)
机器人I/O模块包括:接收PID控制器模块发送的角速度的增量△ω,根据公式(5)计算得到当前时刻t要发送给移动机器人的角速度ωt,其中ωt-1是上一时刻t-1发送给移动机器人的角速度;接收动作策略模块发送的线速度作为当前时刻t要发送给移动机器人的线速度vt;发送当前时刻t的运动指令,即线速度vt和角速度ωt,给移动机器人;发送实时的运动信息和位姿信息给动作策略模块,发送实时的彩色相机图像信息给图像处理模块;
机器人模块包括:移动机器人接收运动指令线速度vt和角速度ωt后,控制移动机器人进行循线运动,并实时返回运动信息、位姿信息和彩色相机图像信息给机器人I/O模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110522424.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑工程用的钢筋除锈装置
- 下一篇:账户选择方法以及电子设备