[发明专利]用于RoboMaster人工智能挑战赛的机器人强化学习训练环境系统在审
申请号: | 202010491376.2 | 申请日: | 2020-06-02 |
公开(公告)号: | CN111882027A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 方逸然;张雪峰;田宇飞 | 申请(专利权)人: | 东南大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;B25J9/16 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 robomaster 人工智能 挑战赛 机器人 强化 学习 训练 环境系统 | ||
1.一种用于RoboMaster人工智能挑战赛的机器人强化学习训练环境系统,其特征在于:该系统总共可分为三个部分,分别是物理引擎、模型控制器、比赛模拟器三个模块,该系统使用了Gazebo作为物理引擎,C++程序作为模型控制器,OpenAI Gym接口与强化学习算法和控制器互动。
2.根据权利要求1所述的用于RoboMaster人工智能挑战赛的机器人强化学习训练环境系统,其特征在于:比赛模拟器在于模拟比赛的进行,将比赛的进行分解为多个小的步骤(step),互动函数的运行逻辑如下:
步骤1:计算场上奖励和惩罚区的更新信息到机器人,
步骤1.1:每台机器人,判断是否在奖励区内,获得奖励区编号;
步骤1.2:如果奖励/惩罚区没有被占用,获得奖励区类型,更新并应用机器人奖励;
状态,否则删除机器人的奖励状态;
步骤1.3:如果机器人进入的是惩罚区,则除步骤1.2之外,还需记录当前时间点;
步骤1.4:遍历各个奖惩区域,判断是否有机器人进入到惩罚区,如果有,则判断惩罚时间是否结束,如果结束则恢复机器人状态;
步骤2:根据机器人的实际位置,计算机器人的枪口朝向,机器人的正面会指向最近的对手;
步骤2.1:根据获得的机器人位置信息,获得距每台机人最近的且存活的对手机器人的编号;
步骤2.2:每台机器人最近对手机器人的编号,利用位置信息计算应偏转的角度;
步骤3:模拟控制机器人的移动和转向,
步骤3.1:应用对手机器人的动作,对手机器人的动作可以选择随机赋值,也可以选择使用已训练好的模型;
步骤3.2:对己方机器人和对手机器人的动作进行解码;
步骤3.3:将动作信息和偏转角度信息通过ROS发送给控制器模块进行控制;
步骤4:运行物理引擎进行仿真;
步骤5:更新奖励和惩罚区,仅当剩余时间60s或120s时进行;
步骤5.1:根据中心对称的原则随机确定奖惩区位置;
步骤5.2:计算当前的奖励状态编号,总共应存在48种编号;
步骤5.3:刷新机器人的奖惩区状态;
步骤6:应用射击和伤害模型;
步骤6.1:排除已经死亡的机器人;
步骤6.2:排除处于“禁止射击”状态的机器人;
步骤6.3:设定基础命中率85%,如果机器人之间存在墙壁阻挡或其他机器人阻挡,则命中率降低为0%;
步骤6.4:如果不存在阻挡,根据机器人与对手机器人之间的距离确定命中率;
步骤6.5:根据打击对手的角度不同,结合步骤6.4中的命中率,得到造成的伤害;
步骤6.6:根据伤害减少机器人血量。
步骤6.7:记录单次队伍伤害,并将伤害加入总伤害;
步骤7:应用碰撞检测,
步骤7.1:检测每个机器人是否与墙壁碰撞;
步骤7.2:检测每个机器人是否与其他机器人碰撞;
步骤8:判断比赛是否结束,
判断依据包括时间结束、某一方所有机器人血量减少到0,计算奖励。
3.根据权利要求1所述的用于RoboMaster人工智能挑战赛的机器人强化学习训练环境系统,其特征在于:模型控制器包括复杂控制器和简单控制器,控制过程分别如下:
复杂控制器的控制逻辑,
步骤1:通过回调函数从Gazebo模拟器中不断地获得机器人状态,包括底盘朝向和云台偏转角。
步骤2:通过回调函数从Gym环境中不断地获得机器人的底盘控制命令。
步骤3:通过速度分解求取机器人底盘坐标系的目标速度。
步骤4:根据目标方向确定机器人云台的朝向,用PID算法控制底盘跟踪云台。
步骤5:使用麦克纳姆轮的速度公式结算各个车轮的速度。
步骤6:发送速度给模拟器
简单控制器的控制逻辑:
步骤1:通过回调函数从Gazebo模拟器中不断地获得机器人状态,包括底盘朝向。
步骤2:通过回调函数从Gym环境中不断地获得机器人的底盘控制命令。
步骤3:通过速度分解求取机器人底盘坐标系的目标速度。
步骤4:发送速度给模拟器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010491376.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大型机器联轴器对中平台
- 下一篇:一种防刮伤手动剃须刀