[发明专利]一种基于深度增强学习的人机协同动态避障方法及系统有效

申请号：	201910208033.8	申请日：	2019-03-19
公开（公告）号：	CN109976340B	公开（公告）日：	2022-02-08
发明（设计）人：	徐昕;姚亮;程榜;尹昕	申请（专利权）人：	中国人民解放军国防科技大学
主分类号：	G05D1/02	分类号：	G05D1/02
代理公司：	长沙国科天河知识产权代理有限公司 43225	代理人：	邱轶
地址：	410073 湖***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种基于深度增强学习方法的智能车动态避障方法及系统，包括S1、获取智能车在t时刻的图像；S2、将图像输入神经网络模型，输出智能车的执行各个动作对应的概率；S3、选择智能车在t时刻的执行动作；S4、记录智能车在t时刻的仿真数据；S5、令t＝t+1，重复S1‑S4直至仿真结束，将仿真数据存档；S6、从正样本经验池或负样本经验池中抽调仿真数据对神经网络模型进行训练的同时循环S1‑S6连续训练至仿真过程中智能车的动态避障策略能完全进行动态避障；后利用训练出的动态避障策略应用到人机协同机制下的动态避障，互补人类驾驶员与智能机器在智能车的应急避让的行为决策上各自优势，达到统一极优的决策方法。本发明应用于智能车的智能决策领域。
搜索关键词：	一种基于深度增强学习人机协同动态方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种人机协同机制下的基于深度增强学习方法的智能车动态避障方法，其特征在于，包括以下步骤：S1、获取智能车在t时刻的仿真感知图像I_t；S2、将仿真感知图像I_t输入神经网络模型，神经网络模型输出智能车在t时刻的状态特征s_t以及执行各个动作对应的概率；S3、根据各个动作对应的概率的分布选择智能车在t时刻的执行动作a_t并输出；S4、将t时刻的动作a_t输入马尔可夫决策环境模型，观测并记录t时刻的状态s_t到t+1时刻的状态s_t+1存储状态转移(s_t,s_t+1)同时计算t时刻到t+1时刻的回报值rt，记录智能车在t时刻的仿真数据(s_t、a_t、r_t、s_t+1)；S5、令t＝t+1，重复步骤S1‑S4直至该组仿真结束，并根据仿真结果将该组仿真的所有仿真数据{(s_t、a_t、r_t、s_t+1)丨t＝1，2，3，···}存档至正样本经验池或负样本经验池；S6、从正样本经验池或负样本经验池中抽调仿真数据对神经网络模型进行训练优化同时循环步骤S1‑S5连续训练直至仿真过程中智能车的动态避障策略能完全进行动态避障，进而完成智能车动态避障模型的构建；S7、将步骤S6构建的智能车动态避障模型装载在智能车上，当智能车行驶过程中前方出现动态障碍物时，智能车依据人机协同策略的决策将驾驶权在驾驶员与智能车动态避障模型之间进行切换，以协助驾驶员动态避障。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学，未经中国人民解放军国防科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910208033.8/，转载请声明来源钻瓜专利网。

上一篇：一种车载配网巡检数据采集方法与巡检系统
下一篇：一种自动驾驶车辆附着路网的方法、车载设备及存储介质

同类专利

专利分类

G 物理

G05 控制；调节
G05D 非电变量的控制或调节系统
G05D1-00 陆地、水上、空中或太空中的运载工具的位置、航道、高度或姿态的控制，例如自动驾驶仪
G05D1-02 .二维的位置或航道控制
G05D1-04 .高度或深度的控制
G05D1-08 .姿态的控制，即摇摆、俯仰角或偏航角的控制
G05D1-10 .三维的位置或航道的同时控制
G05D1-12 .寻找目标的控制

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度增强学习的人机协同动态避障方法及系统有效

专利文献下载