[发明专利]一种基于强化学习的增强现实多智能体协作对抗实现方法在审
申请号: | 202110571637.6 | 申请日: | 2021-05-25 |
公开(公告)号: | CN113435564A | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 陈靖;张君瑞;周俊研 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06N3/00 | 分类号: | G06N3/00;G06T17/20;G06T15/00 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 李微微 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 增强 现实 智能 体协 对抗 实现 方法 | ||
1.一种基于强化学习的增强现实多智能体协作对抗实现方法,其特征在于,包括如下步骤:
步骤1:在离线阶段,对真实场景进行建模,构建稠密的三维点云地图并三角网格化;
步骤2:仿照真实场景搭建虚拟仿真对抗环境对多智能体进行训练,包括如下步骤:
(1)仿照真实场景,再搭建虚拟仿真对抗场景,将多个智能体设置在该虚拟仿真对抗场景中;多个智能体分为互为对抗的两队,对抗双方均可在场景中自由移动,双方的任务目标均为团队协作配合歼灭对方装备,以此形成仿真对抗环境;
(2)为对抗双方分别设置一个策略模型,同队的智能体之间共享一套策略模型参数;
(3)利用三维渲染引擎Unity3D自带组件MLAgent完成对智能体的状态输入、奖励设置和动作输出;
(4)智能体根据不断输入的状态输入、奖励信息及动作输出对策略模型进行循环往复训练;
步骤3:训练完成后,在线阶段导入训练完成的智能体策略模型,将步骤1构建好的真实场景模型导入三维渲染引擎,并在其中添加刚体组件;然后将装备渲染在真实场景中的相应位置,实现后续增强现实仿真对抗环境的渲染绘制;
步骤4:实时获取用户的六自由度全局位姿,并传递给三维渲染引擎中的虚拟相机;
步骤5:导入真实摄像机捕获的画面,渲染在真实场景中;
步骤6:将步骤1中构建的真实场景模型隐藏,保留刚体组件,用于碰撞检测,最终形成用户在真实场景中与智能体进行交互的增强现实仿真对抗环境,与智能体之间形成协作完成对抗任务。
2.如权利要求1所述的一种基于强化学习的增强现实多智能体协作对抗实现方法,其特征在于,所述步骤2中,训练过程结合课程训练模式,将场景复杂度分为简单、中等、困难三个程度,在训练是按顺序采用该三个复杂度对策略模型进行训练。
3.如权利要求1所述的一种基于强化学习的增强现实多智能体协作对抗实现方法,其特征在于,所述步骤3中,利用世界坐标系、相机坐标系、图像坐标系和像素坐标系之间的如下转换公式,将装备渲染在真实场景中的相应位置:
上式中,(ε,η,δ)是智能体在世界坐标系中的三维位置信息;TCW表示从世界坐标系到相机坐标系的转换;相机模型决定相机坐标系与图像坐标系的转换关系;对于透视投影模型,θ表示相机的纵向视角,n是从相机中心到近裁剪平面的距离,f是从相机中心到远裁剪平面的距离,Aspect是投影图像的长宽比,K是相机的内部参数,Zc和γ与深度有关。
4.如权利要求1所述的一种基于强化学习的增强现实多智能体协作对抗实现方法,其特征在于,采用实时跟踪定位算法实时获取用户的六自由度全局位姿。
5.如权利要求1所述的一种基于强化学习的增强现实多智能体协作对抗实现方法,其特征在于,智能体中采用python软件接收状态输入和奖励信息并训练模型。
6.如权利要求1所述的一种基于强化学习的增强现实多智能体协作对抗实现方法,其特征在于,所述步骤1中,利用三维激光扫描仪对真实场景进行建模。
7.如权利要求1所述的一种基于强化学习的增强现实多智能体协作对抗实现方法,其特征在于,状态输入包括:以向量形式表征的周围智能体的属性和方位以及自身相关状态信息;友方智能体的图像信息和位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110571637.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种橡胶密封胶条
- 下一篇:一种基于隧道电缆使用具有警示照明作用的链式抱箍