[发明专利]路径规划模型的训练、路径规划方法、装置及电子设备有效
申请号: | 202111035827.2 | 申请日: | 2021-09-06 |
公开(公告)号: | CN113467487B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 徐博;成芳娟;张鸿铭;王燕娜 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 北京墨丘知识产权代理事务所(普通合伙) 11878 | 代理人: | 谷轶楠 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例涉及强化学习技术领域,具体涉及路径规划模型的训练、路径规划方法、装置及电子设备,其中,所述训练方法包括:获取样本数据以及剩余决策次数,所述样本数据包括当前时刻的环境状态以及损失计算参数;将当前时刻的环境状态以及剩余决策次数输入路径规划模型,并利用剩余决策次数对路径规划模型预测结果中的非空动作进行约束,以输出当前时刻的执行动作并更新所述剩余决策次数,所述路径规划模型是基于强化学习模型建立的;根据当前时刻的执行动作以及损失计算参数进行损失函数的计算,并基于计算结果更新路径规划模型的参数,以确定目标路径规划模型。将决策次数作为约束条件,使得训练得到的目标路径规划模型能够应用在决策次数受限的场景下。 | ||
搜索关键词: | 路径 规划 模型 训练 方法 装置 电子设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111035827.2/,转载请声明来源钻瓜专利网。