[发明专利]用于训练参数化策略的装置和方法在审
申请号: | 202180036524.4 | 申请日: | 2021-02-04 |
公开(公告)号: | CN115668215A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 文森特·莫恩斯;胡格斯·范·阿塞尔;海瑟姆·布·阿马尔 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/00 | 分类号: | G06N3/00;G06N5/00;G06N7/00;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种用于根据提议分布训练参数化策略的装置,所述装置包括一个或多个处理器,所述一个或多个处理器用于重复执行以下步骤:根据所述提议分布形成提议;将所述提议输入到所述策略中,以根据所述提议的所述策略形成输出状态;估计所述输出状态与所述提议的优选状态之间的损失;通过自适应算法并根据所述损失形成策略自适应;对所述策略应用所述策略自适应,以形成自适应策略;通过所述自适应策略,形成所述策略自适应的方差估计值;根据所述方差估计值,自适应所述提议分布,以减小在所述步骤的后续迭代中形成的策略自适应的方差。 | ||
搜索关键词: | 用于 训练 参数 策略 装置 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202180036524.4/,转载请声明来源钻瓜专利网。
- 上一篇:耳机
- 下一篇:用于涡轮机的涡轮转子以及用于安装该转子的方法