[发明专利]一种序贯同步时序蒙特卡洛搜索算法在审

专利信息
申请号: 201810784095.9 申请日: 2018-07-17
公开(公告)号: CN109002893A 公开(公告)日: 2018-12-14
发明(设计)人: 王骄;代欣颖 申请(专利权)人: 东北大学
主分类号: G06N5/00 分类号: G06N5/00
代理公司: 大连东方专利代理有限责任公司 21212 代理人: 李洪福
地址: 110819 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 搜索算法 博弈 搜索系统 同步时序 博弈树 搜索 搜索服务器 节点存储 节点压缩 决策问题 时间周期 搜索过程 搜索装置 问题模型 固定的 连接边 树结构 同一层 多层 建模 决策
【权利要求书】:

1.一种序贯同步时序蒙特卡洛搜索算法,所述搜索算法适用于一种搜索系统,该搜索系统包括搜索服务器、搜索入口及搜索装置,其特征在于,所述搜索算法包括以下步骤:

步骤1-1:设计一种博弈树结构,更改标准蒙特卡洛博弈树节点存储信息和连接边的意义,将标准蒙特卡洛博弈树上含有博弈各方信息的多层节点压缩到同一层,令{S1,S2,S3,S4,...}表示每次树搜索后的节点,{a1,a2,b1,b2}表示双方动作组合,使新的博弈树在每一次树搜索时都会得到每个动作执行后的转移节点,节点信息由原来存储的单方信息变为各方信息,节点间的每条连接边表示博弈各方合法动作组合,形式如:S1→S2∈{Sa1,Sa2,Sb1,Sb2};

步骤1-2:在新的博弈树中每一层的节点按固定的时间周期进行划分,对于执行时间不同的动作,会出现跨时间周期进行树搜索的情况,其执行完的状态和其他动作执行完的状态处于不同时间周期内,即在不同层内,形式如:

其中动作b2执行后的状态Sb2在其出现的周期内进行收益的计算。

2.根据权利要求1所述的搜索算法,其特征在于:步骤1-2中所述树搜索加入有时序控制部分,该部分包括以下步骤:

步骤2-1:在博弈树中加入时间轴,将时间轴按固定的时间周期T进行划分,保证博弈各方的状态都严格落在相应的固定时间周期节点上,博弈各方严格按照固定的时间节点做出决策;

步骤2-2:当某一动作需要执行多个时间周期,在其执行过程中的每个时间节点上设置虚拟节点,形成完整的序贯同步时序蒙特卡洛博弈树。

3.根据权利要求1或2所述的搜索算法,其特征在于:所述搜索算法的搜索过程至少包括选择、扩展、模拟、更新四个阶段。

4.根据权利要求3所述的搜索算法,其特征在于:

选择阶段序贯同步博弈问题在每个时间点上具有同步特性,博弈树中根据各方所选动作的组合来选择子节点,有以下三种选择方法:

A引入策略网络PolicyNet,利用网络的学习能力在线学习决策动作分布,计算节点下子节点的状态的悔恨值regret,通过判断regret的大小对博弈方的选择进行指导;

B针对中小规模(动作集合大小<=4)的问题,在线或离线计算不同状态的均衡解,将得到的均衡解存入表中,在选择时供博弈树查询,选择出最有利的子节点;

C将A、B两种方法结合在一起,在搜索的开始时利用策略网络指导动作的选择,在博弈树已经被搜索超过一半时,再通过在线方式计算接下来状态的均衡解,利用均衡解的值对子节点的选择进行指导。

5.根据权利要求4所述的搜索算法,其特征在于,所述选择阶段节点中的信息包括己方平均悔恨值,己方动作组合,对方平均悔恨值,对方动作组合以及该节点的访问次数,还包括己方收益表和对方收益表,在收益表中,每一个元素对应博弈某一方的一个动作组合;令S∈{1,2,3,...}表示每次迭代,h表示每次迭代中的某一个节点状态,T为时间周期,令(a,b)为其动作组合,PS(h,T)表示博弈各方当前时间周期所用的混合策略,此混合策略由进行初始化,博弈各方都为混合策略PS(h,T)维持一个累计的悔恨值rh[(a,b)],其初始化为0,在每次迭代中,需要根据当前累计的收益来生成新的混合策略,定义累计收益为x+=max(x,0),公式如下:

6.根据权利要求3所述的搜索算法,其特征在于:扩展阶段根据博弈各方不同的动作组合进行展开,其中,每条边代表的是博弈各方的动作组合,在扩展的同时不断选择更加适合的动作组合,舍弃无用的动作组合,即在扩展的过程中同时对博弈树进行剪枝处理。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810784095.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top