[发明专利]基于深度强化学习的智能车速度决策方法及其仿真方法有效
申请号: | 202010788354.2 | 申请日: | 2020-08-07 |
公开(公告)号: | CN111898211B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 赵海艳;陈伟轩;刘晓斌;赵津杨;冯宇驰 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F30/15 | 分类号: | G06F30/15;G06F30/20;G06N3/04;G06N3/08 |
代理公司: | 长春吉大专利代理有限责任公司 22201 | 代理人: | 杜森垚 |
地址: | 130012 吉林省长春市*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度强化学习方法的智能车速度决策方法,构造智能车通过路口的马尔可夫决策模型的状态空间S,动作空间A,即时奖赏空间R;初始化神经网络,构建经验池;采用ε‑greedy算法进行动作的选择,并将此次经验填加进所述步骤二构建的经验池;从经验池随机选出一部分经验,采用随机梯度下降法训练神经网络;根据最新神经网络完成当前时刻智能车的速度决策,并将此次经验填加至经验池,随机选取一部分经验再进行新一轮神经网络的训练。本发明同时公开了一种基于深度强化学习的智能车速度决策方法的仿真方法,基于matlab自动驾驶工具箱搭建的深度强化学习仿真系统进行仿真实验。 | ||
搜索关键词: | 基于 深度 强化 学习 智能 车速 决策 方法 及其 仿真 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010788354.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种升降设备辅助装置、升降设备
- 下一篇:不锈钢材质零件表面电镀锌镍工艺