[发明专利]基于想象力的代理神经网络在审
申请号: | 201880028596.2 | 申请日: | 2018-05-22 |
公开(公告)号: | CN110892420A | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 丹尼尔·彼得·维尔斯特拉;李宇佳;拉兹万·帕什卡努;彼得·威廉·巴塔利亚;塞奥法尼·纪尧姆·韦伯;拉尔斯·比辛;戴维·保罗·赖克特;亚瑟·克莱蒙特·格斯;丹尼洛·吉米内斯·雷森德;阿德里亚·普伊赫多梅内奇·巴迪亚;奥里奥尔·温亚尔斯;尼古拉斯·曼弗雷德·奥托·黑斯;塞巴斯蒂安·亨利·拉卡涅雷 | 申请(专利权)人: | 渊慧科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N3/00 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李宝泉;任庆威 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提出了一种神经网络系统。所述网络能够由基于模型的强化学习训练,以选择要由与环境交互的代理执行的动作,以执行任务从而试图实现指定的结果。所述系统可包括:至少一个想象力核心,并且包括所述环境的模型,所述想象力核心具有输入,以接收表征所述环境的当前状态的当前观察,并可选地接收历史观察。所述想象力核心可被配置成响应于所述当前观察和/或历史观察而输出轨迹数据。所述轨迹数据包括所述想象力核心想象的所述环境的未来特征的序列。所述系统还包括:至少一个卷展编码器,以对所述特征的序列进行编码;和强化学习输出级,以接收从所述卷展嵌入中导出的数据,并输出动作策略数据,从而定义基于所述当前观察来识别动作的动作策略。 | ||
搜索关键词: | 基于 想象力 代理 神经网络 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渊慧科技有限公司,未经渊慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201880028596.2/,转载请声明来源钻瓜专利网。