[发明专利]用于RoboMaster人工智能挑战赛的机器人强化学习训练环境系统在审

专利信息
申请号: 202010491376.2 申请日: 2020-06-02
公开(公告)号: CN111882027A 公开(公告)日: 2020-11-03
发明(设计)人: 方逸然;张雪峰;田宇飞 申请(专利权)人: 东南大学
主分类号: G06N3/04 分类号: G06N3/04;B25J9/16
代理公司: 南京众联专利代理有限公司 32206 代理人: 杜静静
地址: 210096 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 robomaster 人工智能 挑战赛 机器人 强化 学习 训练 环境系统
【权利要求书】:

1.一种用于RoboMaster人工智能挑战赛的机器人强化学习训练环境系统,其特征在于:该系统总共可分为三个部分,分别是物理引擎、模型控制器、比赛模拟器三个模块,该系统使用了Gazebo作为物理引擎,C++程序作为模型控制器,OpenAI Gym接口与强化学习算法和控制器互动。

2.根据权利要求1所述的用于RoboMaster人工智能挑战赛的机器人强化学习训练环境系统,其特征在于:比赛模拟器在于模拟比赛的进行,将比赛的进行分解为多个小的步骤(step),互动函数的运行逻辑如下:

步骤1:计算场上奖励和惩罚区的更新信息到机器人,

步骤1.1:每台机器人,判断是否在奖励区内,获得奖励区编号;

步骤1.2:如果奖励/惩罚区没有被占用,获得奖励区类型,更新并应用机器人奖励;

状态,否则删除机器人的奖励状态;

步骤1.3:如果机器人进入的是惩罚区,则除步骤1.2之外,还需记录当前时间点;

步骤1.4:遍历各个奖惩区域,判断是否有机器人进入到惩罚区,如果有,则判断惩罚时间是否结束,如果结束则恢复机器人状态;

步骤2:根据机器人的实际位置,计算机器人的枪口朝向,机器人的正面会指向最近的对手;

步骤2.1:根据获得的机器人位置信息,获得距每台机人最近的且存活的对手机器人的编号;

步骤2.2:每台机器人最近对手机器人的编号,利用位置信息计算应偏转的角度;

步骤3:模拟控制机器人的移动和转向,

步骤3.1:应用对手机器人的动作,对手机器人的动作可以选择随机赋值,也可以选择使用已训练好的模型;

步骤3.2:对己方机器人和对手机器人的动作进行解码;

步骤3.3:将动作信息和偏转角度信息通过ROS发送给控制器模块进行控制;

步骤4:运行物理引擎进行仿真;

步骤5:更新奖励和惩罚区,仅当剩余时间60s或120s时进行;

步骤5.1:根据中心对称的原则随机确定奖惩区位置;

步骤5.2:计算当前的奖励状态编号,总共应存在48种编号;

步骤5.3:刷新机器人的奖惩区状态;

步骤6:应用射击和伤害模型;

步骤6.1:排除已经死亡的机器人;

步骤6.2:排除处于“禁止射击”状态的机器人;

步骤6.3:设定基础命中率85%,如果机器人之间存在墙壁阻挡或其他机器人阻挡,则命中率降低为0%;

步骤6.4:如果不存在阻挡,根据机器人与对手机器人之间的距离确定命中率;

步骤6.5:根据打击对手的角度不同,结合步骤6.4中的命中率,得到造成的伤害;

步骤6.6:根据伤害减少机器人血量。

步骤6.7:记录单次队伍伤害,并将伤害加入总伤害;

步骤7:应用碰撞检测,

步骤7.1:检测每个机器人是否与墙壁碰撞;

步骤7.2:检测每个机器人是否与其他机器人碰撞;

步骤8:判断比赛是否结束,

判断依据包括时间结束、某一方所有机器人血量减少到0,计算奖励。

3.根据权利要求1所述的用于RoboMaster人工智能挑战赛的机器人强化学习训练环境系统,其特征在于:模型控制器包括复杂控制器和简单控制器,控制过程分别如下:

复杂控制器的控制逻辑,

步骤1:通过回调函数从Gazebo模拟器中不断地获得机器人状态,包括底盘朝向和云台偏转角。

步骤2:通过回调函数从Gym环境中不断地获得机器人的底盘控制命令。

步骤3:通过速度分解求取机器人底盘坐标系的目标速度。

步骤4:根据目标方向确定机器人云台的朝向,用PID算法控制底盘跟踪云台。

步骤5:使用麦克纳姆轮的速度公式结算各个车轮的速度。

步骤6:发送速度给模拟器

简单控制器的控制逻辑:

步骤1:通过回调函数从Gazebo模拟器中不断地获得机器人状态,包括底盘朝向。

步骤2:通过回调函数从Gym环境中不断地获得机器人的底盘控制命令。

步骤3:通过速度分解求取机器人底盘坐标系的目标速度。

步骤4:发送速度给模拟器。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010491376.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top