[发明专利]一种序贯同步时序蒙特卡洛搜索算法在审
申请号: | 201810784095.9 | 申请日: | 2018-07-17 |
公开(公告)号: | CN109002893A | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | 王骄;代欣颖 | 申请(专利权)人: | 东北大学 |
主分类号: | G06N5/00 | 分类号: | G06N5/00 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李洪福 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种序贯同步时序蒙特卡洛搜索算法,所述搜索算法适用于一种搜索系统,所述搜索系统包括搜索服务器、搜索入口及搜索装置所述搜索算法包括以下步骤:设计一种博弈树结构,更改标准蒙特卡洛博弈树节点存储信息和连接边的意义,将标准蒙特卡洛博弈树上含有博弈各方信息的多层节点压缩到同一层;以及在新的博弈树中每一层的节点按固定的时间周期进行划分。通过本搜索算法在问题模型方面,实现了对序贯同步决策问题的良好建模;在搜索过程方面,使搜索更加贴近序贯同步决策博弈问题的同步特点。 | ||
搜索关键词: | 搜索算法 博弈 搜索系统 同步时序 博弈树 搜索 搜索服务器 节点存储 节点压缩 决策问题 时间周期 搜索过程 搜索装置 问题模型 固定的 连接边 树结构 同一层 多层 建模 决策 | ||
【主权项】:
1.一种序贯同步时序蒙特卡洛搜索算法,所述搜索算法适用于一种搜索系统,该搜索系统包括搜索服务器、搜索入口及搜索装置,其特征在于,所述搜索算法包括以下步骤:步骤1‑1:设计一种博弈树结构,更改标准蒙特卡洛博弈树节点存储信息和连接边的意义,将标准蒙特卡洛博弈树上含有博弈各方信息的多层节点压缩到同一层,令{S1,S2,S3,S4,...}表示每次树搜索后的节点,{a1,a2,b1,b2}表示双方动作组合,使新的博弈树在每一次树搜索时都会得到每个动作执行后的转移节点,节点信息由原来存储的单方信息变为各方信息,节点间的每条连接边表示博弈各方合法动作组合,形式如:S1→S2∈{Sa1,Sa2,Sb1,Sb2};步骤1‑2:在新的博弈树中每一层的节点按固定的时间周期进行划分,对于执行时间不同的动作,会出现跨时间周期进行树搜索的情况,其执行完的状态和其他动作执行完的状态处于不同时间周期内,即在不同层内,形式如:
其中动作b2执行后的状态Sb2在其出现的周期内进行收益的计算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810784095.9/,转载请声明来源钻瓜专利网。