[发明专利]强化学习的方法和装置在审
申请号: | 202010308484.1 | 申请日: | 2020-04-18 |
公开(公告)号: | CN111612126A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 刘扶芮;寸文璟;陈志堂 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 陈洪艳;王君 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及人工智能,提供了一种强化学习方法和装置,能够提高强化学习的训练效率。该方法包括:获取结构图,结构图包括通过学习获取的环境或智能体的结构信息;向智能体的策略函数输入环境的当前状态和结构图,策略函数用于生成响应于当前状态和结构图的动作,智能体的策略函数为图神经网络;利用智能体向环境输出动作;利用智能体从环境获取响应于动作的下一个状态和奖励数据;根据奖励数据,对智能体进行强化学习的训练。 | ||
搜索关键词: | 强化 学习 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010308484.1/,转载请声明来源钻瓜专利网。