[发明专利]基于DQN的车间多功能机器人有效
申请号: | 202011615034.3 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112782980B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 敖邦乾;梁定勇;敖帮桃;令狐金卿 | 申请(专利权)人: | 遵义师范学院 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 重庆强大凯创专利代理事务所(普通合伙) 50217 | 代理人: | 向林 |
地址: | 563006 贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 dqn 车间 多功能 机器人 | ||
1.一种基于DQN的车间多功能机器人,其特征在于:包括:
DQN神经网络模型构建模块,用于根据以下算法模型构建DQN神经网络模型:
Q(St,at)←Q(St,at)+α[Rt+γQ(St’,at’)-Q(St,at)]
其中,γ表示折扣因子,α表示学习率,Rt表示积累回报值,St表示在当前时间t的状态;
训练模块,用于对DQN神经网络模型进行训练;
SLAM图像构建模块,用于根据传感器数据生成SLAM图像;所述SLAM图像构建模块包括RPLIDAR数据获取模块、RGBD数据获取模块以及数据融合模块,所述RPLIDAR数据获取模块用于获取环境一维构图数据,所述RGBD数据获取模块用于获取环境二维构图数据,所述数据融合模块用于根据环境一维构图数据和环境二维构图数据生成环境空间的SLAM图像;
环境状态生成模块,用于根据SLAM图像生成状态;
可行动作集构建模块,用于将坐标平面划分N个方向,形成可行动作集;
控制模块,用于将可行动作集以及SLAM图像数据作为输入,通过DQN神经网络模型输出行为控制决策;
所述N为64;所述DQN神经网络模型包括两个卷积层,所述两个卷积层的步长均为3,还包括两个全连接层,第一层全连接层设有256个节点,第二层全连接层设有8个节点;
所述Rt按照以下公式计算:
其中,rt表示在当前时间t,状态s下采取行动a之后的回报值;
rt定义如下:当机器人朝向目的地运动且无碰撞时,取值为5;当机器人与目的地反向时或当机器人与周围障碍物相碰撞时取值-5;其它情况时取值为0。
2.根据权利要求1所述的基于DQN的车间多功能机器人,其特征在于:所述训练模块采用随机梯度下降法来最小化损失函数来不断调整网络权重。
3.根据权利要求2所述的基于DQN的车间多功能机器人,其特征在于:所述训练模块采用的损失函数定义如下:
Li(θi)=E[(TargetQ-Q(s,a;θi))2]
TargetQ=r+γQ(si,ai;θi-)
其中,θi-表示第i次迭代的目标网络参数,θi则是Q-network网络参数。
4.根据权利要求3所述的基于DQN的车间多功能机器人,其特征在于:RPLIDAR数据获取模块获取环境一维沟通数据时加入随机高斯噪声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于遵义师范学院,未经遵义师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011615034.3/1.html,转载请声明来源钻瓜专利网。