[发明专利]一种基于深度增强学习的人机协同动态避障方法及系统有效

专利信息
申请号: 201910208033.8 申请日: 2019-03-19
公开(公告)号: CN109976340B 公开(公告)日: 2022-02-08
发明(设计)人: 徐昕;姚亮;程榜;尹昕 申请(专利权)人: 中国人民解放军国防科技大学
主分类号: G05D1/02 分类号: G05D1/02
代理公司: 长沙国科天河知识产权代理有限公司 43225 代理人: 邱轶
地址: 410073 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于深度增强学习方法的智能车动态避障方法及系统,包括S1、获取智能车在t时刻的图像;S2、将图像输入神经网络模型,输出智能车的执行各个动作对应的概率;S3、选择智能车在t时刻的执行动作;S4、记录智能车在t时刻的仿真数据;S5、令t=t+1,重复S1‑S4直至仿真结束,将仿真数据存档;S6、从正样本经验池或负样本经验池中抽调仿真数据对神经网络模型进行训练的同时循环S1‑S6连续训练至仿真过程中智能车的动态避障策略能完全进行动态避障;后利用训练出的动态避障策略应用到人机协同机制下的动态避障,互补人类驾驶员与智能机器在智能车的应急避让的行为决策上各自优势,达到统一极优的决策方法。本发明应用于智能车的智能决策领域。
搜索关键词: 一种 基于 深度 增强 学习 人机 协同 动态 方法 系统
【主权项】:
1.一种人机协同机制下的基于深度增强学习方法的智能车动态避障方法,其特征在于,包括以下步骤:S1、获取智能车在t时刻的仿真感知图像It;S2、将仿真感知图像It输入神经网络模型,神经网络模型输出智能车在t时刻的状态特征st以及执行各个动作对应的概率;S3、根据各个动作对应的概率的分布选择智能车在t时刻的执行动作at并输出;S4、将t时刻的动作at输入马尔可夫决策环境模型,观测并记录t时刻的状态st到t+1时刻的状态st+1存储状态转移(st,st+1)同时计算t时刻到t+1时刻的回报值rt,记录智能车在t时刻的仿真数据(st、at、rt、st+1);S5、令t=t+1,重复步骤S1‑S4直至该组仿真结束,并根据仿真结果将该组仿真的所有仿真数据{(st、at、rt、st+1)丨t=1,2,3,···}存档至正样本经验池或负样本经验池;S6、从正样本经验池或负样本经验池中抽调仿真数据对神经网络模型进行训练优化同时循环步骤S1‑S5连续训练直至仿真过程中智能车的动态避障策略能完全进行动态避障,进而完成智能车动态避障模型的构建;S7、将步骤S6构建的智能车动态避障模型装载在智能车上,当智能车行驶过程中前方出现动态障碍物时,智能车依据人机协同策略的决策将驾驶权在驾驶员与智能车动态避障模型之间进行切换,以协助驾驶员动态避障。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910208033.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top