[发明专利]一种结合知识转移的强化学习方法及其应用于无人车自主技能的学习方法有效
申请号: | 201910017601.6 | 申请日: | 2019-01-09 |
公开(公告)号: | CN109740741B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 丁子凡;丁德锐;王永雄;魏国亮;鄂贵 | 申请(专利权)人: | 上海理工大学 |
主分类号: | G06N3/092 | 分类号: | G06N3/092;G06N3/096;G06N3/042;G06N3/048;G06N3/084;G06N5/04;B60W40/00 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 陆惠中;王永伟 |
地址: | 200093 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种结合知识转移的强化学习方法,步骤如下:S1、设计BP神经网络自主任务间映射关系;S2、对源任务学习经验进行案例存储,并构建线性感知器来学习源域和目标域之间的动作映射关系;S3、运用基于案例推理机理;S4、进行相似度计算与案例检索,并运用所学到的案例库中的经验作为启发式来加速相关但不同任务的学习;及其应用于无人车自主技能的学习方法;本发明结合强化学习与迁移学习的优势,可实现机器人从简单领域或源域获得的经验通过迁移加速应用到复杂领域或目标域中;学习速度快,可避免维数灾难;显著的提高了无人车自主技能学习的速度和效率。 | ||
搜索关键词: | 一种 结合 知识 转移 强化 学习方法 及其 应用于 无人 自主 技能 | ||
【主权项】:
1.一种结合知识转移的强化学习方法,其特征在于,具体包括以下步骤:S1、设计BP神经网络自主任务间映射关系,通过对源任务中的学习经验进行映射来初始化目标任务,为目标任务设置先验;S2、对源任务学习经验进行案例存储,并构建线性感知器来学习源域和目标域之间的动作映射关系;S3、运用基于案例推理机理,在目标任务进行学习时对其在线学习经验进行存储来扩充案例库,并提出渐进遗忘准则对案例库所存储经验中长期不被利用的信息进行清除,以减少匹配检索时间;S4、进行相似度计算与案例检索,并运用所学到的案例库中的经验作为启发式来加速相关但不同任务的学习。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理工大学,未经上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910017601.6/,转载请声明来源钻瓜专利网。