[发明专利]一种基于深度强化学习进行流体导向的刚体控制的方法有效
申请号: | 201810741737.7 | 申请日: | 2018-07-09 |
公开(公告)号: | CN108983605B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 任博;田韵声;马平川;潘哲融 | 申请(专利权)人: | 南开大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 天津耀达律师事务所 12223 | 代理人: | 侯力 |
地址: | 300071*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于深度强化学习进行流体导向的刚体控制的方法。本方法通过仅在模拟区域边界施加控制作用力来改变流体‑刚体模拟器的行为,同时模拟区域内部通过Navier‑Stokes方程控制流体以及Newton‑Euler方程控制刚体。本方法的控制器是用深度强化学习训练的神经网络,经过预先训练便可用来在线生成控制动作。基于本方法的控制器接收流体与刚体的状态作为输入,控制流体喷口在边界移动并向模拟区域内部的刚体喷射流体,不仅可生成物理上真实的模拟效果,而且在很多2维流体‑刚体控制任务上都取得了很好的效果。本方法也可以扩展到3维流体‑刚体耦合系统,比如可以控制刚体准确运动到指定3维目标点。 | ||
搜索关键词: | 一种 基于 深度 强化 学习 进行 流体 导向 刚体 控制 方法 | ||
【主权项】:
1.一种基于深度强化学习进行流体导向的刚体控制的方法,其特征在于:所述方法的控制对象为遵循Navier‑Stokes方程的流体和遵循Newton‑Eular方程的刚体耦合系统;具体控制步骤包括:第1:利用一种基于神经网络的自编码器,无监督地捕获流体速度场最重要的结构特征,并用该特征进行控制;第2:利用一种深度强化学习算法,优化神经网络控制参数,网络接收系统状态为输入,生成每一时间步在模拟边界的控制动作;第3:通过训练,通常训练时间为数小时至数十小时,控制器能够完成多种复杂的流体导向的刚体运动控制任务。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810741737.7/,转载请声明来源钻瓜专利网。