[发明专利]具有中间信号的非固定延迟老虎机在审
申请号: | 202011336985.7 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112836117A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | C.弗纳德;A.吉奥吉;T.A.曼恩 | 申请(专利权)人: | 渊慧科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N7/00;G06N20/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 从要在环境中执行的动作集合中选择动作的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。方法之一包括,在每个时间步:维护计数数据;对于每个动作,确定相应当前转移概率分布,该相应当前转移概率分布包括中间信号中的每一个的相应当前转移概率,该当前转移概率表示如果该动作被执行则中间信号将被观察到的当前可能性的估计;对于每个中间信号,确定相应的奖励估计,该相应的奖励估计是作为观察到中间信号的结果将接收到的奖励的估计;从相应当前转移概率分布和相应的奖励估计确定每个动作的相应动作得分;以及基于相应动作得分来选择要执行的动作。 | ||
搜索关键词: | 具有 中间 信号 固定 延迟 老虎机 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渊慧科技有限公司,未经渊慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011336985.7/,转载请声明来源钻瓜专利网。
- 上一篇:用于机动车的电子部件的冷却组件
- 下一篇:用于调节时计桥的机构