[发明专利]对深度学习网络的注意力的持续控制有效

申请号：	201910654581.3	申请日：	2019-07-19
公开（公告）号：	CN110732137B	公开（公告）日：	2023-04-18
发明（设计）人：	大泽升平;恐神贵行	申请（专利权）人：	国际商业机器公司
主分类号：	A63F13/55	分类号：	A63F13/55;G06N7/01;G06N3/0464;G06N3/084
代理公司：	北京市中咨律师事务所 11247	代理人：	李永敏;于静
地址：	美国***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种用于通过实现对深度学习网络的注意力的连续控制来降低与由计算机系统执行的机器学习任务相关联的计算成本的计算机实现的方法包括：初始化控制‑值函数、观察‑值函数以及与当前情节相关联的状态序列。如果与当前情节相关联的当前周期是奇数，则选择观察动作，执行观察动作以观察部分图像，并且基于部分图像和控制‑值函数更新观察‑值函数。如果当前周期是偶数，则选择控制动作，执行控制动作以获得与控制动作对应的回报，并且基于回报和观察‑值函数更新控制‑值函数。
搜索关键词：	深度学习网络注意力持续控制
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种用于通过实现对深度学习网络的注意力的持续控制来降低与由计算机系统所执行的机器学习任务相关联的计算成本的计算机实现的方法，包括：/n由可操作地耦接到存储器设备的至少一个处理器初始化控制-值函数、观察-值函数和与当前情节相关联的状态序列；/n如果所述当前情节中的当前周期是奇数，则：/n由所述至少一个处理器选择观察动作；/n由所述至少一个处理器执行所述观察动作，以观察部分图像；以及/n由所述至少一个处理器基于所述部分图像和所述控制-值函数来更新所述观察-值函数；以及/n如果所述当前周期是偶数，则：/n由所述至少一个处理器选择控制动作；/n由所述至少一个处理器执行所述控制动作，以获得与所述控制动作对应的回报；以及/n由所述至少一个处理器基于所述回报和所述观察-值函数来更新所述控制-值函数。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于国际商业机器公司，未经国际商业机器公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910654581.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

A 农业

A63 运动；游戏；娱乐活动
A63F 纸牌、棋盘或轮盘赌游戏；利用小型运动物体的室内游戏；其他类目不包含的游戏
A63F13-00 使用二维或多维电子显示器
A63F13-02 .附件
A63F13-08 .结构零件或布置，例如其他类目不包括的壳体、导线、连接件、操纵台
A63F13-10 .游戏过程的控制，例如开始、进行、结束
A63F13-12 .涉及若干游戏装置之间的相互作用，例如传送和分配系统
A63F13-04 ..用于命中显示器上的特殊区域，如具有光电探测装置的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]对深度学习网络的注意力的持续控制有效

专利文献下载