[发明专利]基于情境感知的策略配置方法及策略配置系统在审
申请号: | 201810718177.3 | 申请日: | 2018-07-03 |
公开(公告)号: | CN109034395A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 张崇洁;李斯源 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N99/00 | 分类号: | G06N99/00 |
代理公司: | 上海巅石知识产权代理事务所(普通合伙) 31309 | 代理人: | 张明;王再朝 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开一种基于情境感知的策略配置方法及策略配置系统,其中,所述策略配置方法包括:当实施一目标任务时,实时感知目标任务的情境,并根据相应的情境信息和策略所属的价值函数,从一策略集中调用最优的策略,其中,所述策略集包括多个策略,所述策略集中部分或全部的策略是在与一目标任务相关的其他任务中学习得到的。如此,不仅可大大加快新的目标任务的学习,更可实现目标任务整体上的最佳学习效果。 | ||
搜索关键词: | 策略配置 情境感知 价值函数 情境信息 实时感知 学习效果 调用 学习 申请 | ||
【主权项】:
1.一种基于情境感知的策略配置方法,其特征在于,包括以下步骤:实施一目标任务,基于情境信息和价值函数,从一策略集中调用一策略;所述策略集包括多个策略,所述策略集中部分或全部的策略是在与一目标任务相关的其他任务中学习得到的,任一个所述策略具有一价值函数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810718177.3/,转载请声明来源钻瓜专利网。