[发明专利]针对基于深度神经网络的Q学习修剪经验存储器的方法和装置在审

申请号：	201780036126.6	申请日：	2017-04-27
公开（公告）号：	CN109348707A	公开（公告）日：	2019-02-15
发明（设计）人：	M·卢西维	申请（专利权）人：	纽拉拉股份有限公司
主分类号：	B25J9/16	分类号：	B25J9/16;G05B15/00;G05B19/18;G06N3/00;G06N3/02;G06N3/04;G06N3/08
代理公司：	中国国际贸易促进委员会专利商标事务所 11038	代理人：	刘凤香
地址：	美国马***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：	本技术涉及由代理收集新经验、将新经验与存储在代理的存储器中的经验进行比较，以及基于比较或者丢弃新经验或者用新经验覆盖存储器中的经验。例如，代理或相关联的处理器可以确定新经验与存储的经验的相似程度。如果新经验太相似，则代理丢弃它；否则，代理将它存储在存储器中并丢弃先前存储的经验。基于经验与先前存储的经验的相似性来收集和选择性地存储经验解决了技术问题并产生了许多技术改进。例如，减轻了存储器大小约束、减少或消除了神经网络发生灾难性遗忘的可能性，并提高了神经网络性能。
搜索关键词：	存储器存储神经网络代理丢弃方法和装置大小约束技术改进相似程度灾难性处理器修剪遗忘关联覆盖
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种用于为机器人生成动作的计算机实现的方法，所述方法包括：收集机器人的第一经验，所述第一经验表示：机器人在第一时间的第一状态，由机器人在所述第一时间采取的第一动作，由机器人响应于所述第一动作而接收的第一奖励，以及在所述第一时间之后的第二时间机器人响应于所述第一动作的第二状态；确定所述第一经验与存储在机器人的存储器中的多个经验之间的相似程度；基于所述第一经验与所述多个经验之间的相似程度来修剪所述存储器中的所述多个经验，以形成存储在所述存储器中的经修剪的多个经验；用所述经修剪的多个经验训练与机器人相关联的神经网络；以及使用神经网络为机器人生成第二动作。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于纽拉拉股份有限公司，未经纽拉拉股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201780036126.6/，转载请声明来源钻瓜专利网。

同类专利

专利分类

B 作业；运输

B25 手动工具；轻便机动工具；手动器械的手柄；车间设备；机械手
B25J 机械手；装有操纵装置的容器
B25J9-00 程序控制机械手
B25J9-02 .以臂的运动为特征的，例如直角坐标型的
B25J9-06 .以多铰接爪臂为特征的
B25J9-08 .以部件结构为特征的
B25J9-10 .以机械手元件定位装置为特征的
B25J9-16 .程序控制

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]针对基于深度神经网络的Q学习修剪经验存储器的方法和装置在审

专利文献下载