[发明专利]通过具有不确定性估计的强化学习的战术决策制定在审

申请号：	202080099710.8	申请日：	2020-04-20
公开（公告）号：	CN115427966A	公开（公告）日：	2022-12-02
发明（设计）人：	卡尔-约翰·赫尔;里奥·莱恩	申请（专利权）人：	沃尔沃自主解决方案公司
主分类号：	G06N3/00	分类号：	G06N3/00;G06N3/04;G06N3/08;G06N7/00
代理公司：	中原信达知识产权代理有限责任公司 11219	代理人：	穆森;戚传江
地址：	瑞典***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种使用强化学习RL代理控制自主车辆的方法(100)，该方法包括：多个训练会话(110‑1，…，110‑K)，其中，RL代理与包括自主车辆的环境交互，每个训练会话具有不同的初始值，并生成取决于状态和动作的状态‑动作值函数Qk(s，a)；决策制定(112)，其中，RL代理输出与自主车辆的控制相关的至少一个暂定决策；基于多个状态‑动作值函数的可变性度量的不确定性估计(114)，该多个状态‑动作值函数针对与暂定决策中的每个相对应的状态‑动作对来评估；以及车辆控制(116)，其中，依赖于所估计的不确定性来执行至少一个暂定决策。
搜索关键词：	通过具有不确定性估计强化学习战术决策制定
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于沃尔沃自主解决方案公司，未经沃尔沃自主解决方案公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202080099710.8/，转载请声明来源钻瓜专利网。

专利分类

免登录下载普通用户下载升级VIP会员，免费下载

专利文献下载