[发明专利]资源受限条件下提高强化学习探索效率的方法有效

申请号：	202210336685.1	申请日：	2022-04-01
公开（公告）号：	CN114492845B	公开（公告）日：	2022-07-15
发明（设计）人：	王杰;王治海;潘涛星;周祺;李厚强	申请（专利权）人：	中国科学技术大学
主分类号：	G06N20/00	分类号：	G06N20/00
代理公司：	北京凯特来知识产权代理有限公司 11260	代理人：	郑立明;付久春
地址：	230026 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种资源受限条件下提高强化学习探索效率的方法，包括：步骤1，智能体通过其运行的强化学习算法的策略网络的策略选择动作去探索环境；步骤2，接受环境返回执行所述智能体动作后的新状态和相应的外在奖励；步骤3，通过资源感知方式计算智能体用于探索环境的内在奖励；步骤4，按以下总体奖励计算公式计算所述智能体的总体奖励；步骤5，根据得出的智能体的总体奖励对所述智能体的强化学习算法的策略网络进行更新；步骤6，判断智能体本轮环境探索得到的所有外在奖励的累积值是否最大化，若否，则回到步骤1重复进行处理，若是，则结束本轮环境探索。该方法能在资源受限条件下，提升智能体应用的主流强化学习方法的探索效率。
搜索关键词：	资源受限条件下提高强化学习探索效率方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学技术大学，未经中国科学技术大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202210336685.1/，转载请声明来源钻瓜专利网。

上一篇：具有高精度校准功能的信号分析仪及其高精度校准方法
下一篇：一种抗氢气渗透的塑料电熔管件

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]资源受限条件下提高强化学习探索效率的方法有效

专利文献下载