[发明专利]一种融合交互式强化学习的增量式认知发育系统及方法有效
申请号: | 201910364754.8 | 申请日: | 2019-04-30 |
公开(公告)号: | CN110070188B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 马昕;黄珂;宋锐;荣学文;田新诚;李贻斌 | 申请(专利权)人: | 山东大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F3/01;G06N3/04 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 董雪 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种融合交互式强化学习的增量式认知发育系统及方法,向分层自组织增量神经网络中引入交互式强化学习,能够同时学习物体概念及通过与人类交互来调整学到的知识;为了实现两种算法的结合,为个别神经网络配备了一个记忆模型,该模型被设计为由两个遗忘因子控制的指数函数,来模拟人类记忆的巩固和遗忘过程;提出了一种交互式强化策略用于提供奖励或惩罚并执行纠错;这些反馈作用于遗忘因子,来强化或削弱神经元的记忆力,从而保留正确的表示,同时忘记错误的表示。实验结果表明,该方法能够有效利用人类反馈,显着提高学习效果,减少模型冗余。 | ||
搜索关键词: | 一种 融合 交互式 强化 学习 增量 认知 发育 系统 方法 | ||
【主权项】:
1.一种融合交互式强化学习的增量式认知发育系统,其特征在于,包括:第一级神经网络:用于处理视觉和听觉特征并生成相应的样本表示;其中,在视觉样本层中,通过动态阈值自组织增量神经网络实现形状和颜色的在线学习;在听觉样本层中,通过Levenshtein距离自组织增量神经网络学习单词向量;第二级神经网络:通过基于符号自组织增量神经网络,分别将第一级神经网络中视觉样本层的形状和颜色在线学习结果以及听觉样本层的单词向量学习结果编码为符号,并实现对各种符号进解码;第三级神经网络:基于关系自组织增量神经网络,建立视觉样本层和听觉样本层中符号之间的关联关系,并根据已知的关联关系向前两级神经网络反馈应答信号;所述具有交互式强化学习的增量式认知发育系统参与学习和实践两个过程,所述学习和实践两个过程以交叉方式执行;通过动态记忆模型在学习过程中更新动态阈值自组织增量神经网络的记忆,在实践过程中同时更新动态阈值自组织增量神经网络和关系自组织增量神经网络的记忆。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910364754.8/,转载请声明来源钻瓜专利网。