[发明专利]一种基于模型强化学习的智能体路径规划方法及系统在审
申请号: | 202310637164.4 | 申请日: | 2023-05-31 |
公开(公告)号: | CN116643499A | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 兰旭光;刘亚新;王浩宇;陈星宇;田智强;齐欧;刘海进 | 申请(专利权)人: | 西安交通大学;灵动科技(北京)有限公司 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 贺小停 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于模型强化学习的智能体路径规划方法及系统,属于机器控制技术领域,包括:获取智能体与环境交互的轨迹图像;将轨迹图像中隐状态作为抽象状态,依照样本的回报大小划分正负样本,正负样本之间通过对比学习,使得正样本投影到同一隐状态,负样本投影到不同隐状态,得到投影后的样本;将抽象学习和模型学习相结合构建带约束的智能体路径规划优化目标模型;再基于KKT条件通过引入超参数构建联合损失函数;将投影后的样本输入联合损失函数中进行求解得到智能体路径规划;输出所述智能体路径规划用于智能体根据作出控制决策。该方法在机器人操作任务和自动驾驶任务等复杂任务表明,本发明在收敛后的性能上有着优异的性能。 | ||
搜索关键词: | 一种 基于 模型 强化 学习 智能 路径 规划 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学;灵动科技(北京)有限公司,未经西安交通大学;灵动科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310637164.4/,转载请声明来源钻瓜专利网。
- 上一篇:像素电路及其驱动方法
- 下一篇:封装结构及封装方法