[发明专利]一种结合知识转移的强化学习方法及其应用于无人车自主技能的学习方法有效

申请号：	201910017601.6	申请日：	2019-01-09
公开（公告）号：	CN109740741B	公开（公告）日：	2023-07-25
发明（设计）人：	丁子凡;丁德锐;王永雄;魏国亮;鄂贵	申请（专利权）人：	上海理工大学
主分类号：	G06N3/092	分类号：	G06N3/092;G06N3/096;G06N3/042;G06N3/048;G06N3/084;G06N5/04;B60W40/00
代理公司：	北京纪凯知识产权代理有限公司 11245	代理人：	陆惠中;王永伟
地址：	200093 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种结合知识转移的强化学习方法，步骤如下：S1、设计BP神经网络自主任务间映射关系；S2、对源任务学习经验进行案例存储，并构建线性感知器来学习源域和目标域之间的动作映射关系；S3、运用基于案例推理机理；S4、进行相似度计算与案例检索,并运用所学到的案例库中的经验作为启发式来加速相关但不同任务的学习；及其应用于无人车自主技能的学习方法；本发明结合强化学习与迁移学习的优势，可实现机器人从简单领域或源域获得的经验通过迁移加速应用到复杂领域或目标域中；学习速度快，可避免维数灾难；显著的提高了无人车自主技能学习的速度和效率。
搜索关键词：	一种结合知识转移强化学习方法及其应用于无人自主技能
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种结合知识转移的强化学习方法，其特征在于，具体包括以下步骤：S1、设计BP神经网络自主任务间映射关系，通过对源任务中的学习经验进行映射来初始化目标任务，为目标任务设置先验；S2、对源任务学习经验进行案例存储，并构建线性感知器来学习源域和目标域之间的动作映射关系；S3、运用基于案例推理机理，在目标任务进行学习时对其在线学习经验进行存储来扩充案例库，并提出渐进遗忘准则对案例库所存储经验中长期不被利用的信息进行清除，以减少匹配检索时间；S4、进行相似度计算与案例检索,并运用所学到的案例库中的经验作为启发式来加速相关但不同任务的学习。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海理工大学，未经上海理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910017601.6/，转载请声明来源钻瓜专利网。

上一篇：卷积计算的定点加速方法及装置
下一篇：一种基于LSTM神经网络的目标跟踪方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种结合知识转移的强化学习方法及其应用于无人车自主技能的学习方法有效

专利文献下载