[发明专利]非完备信息下同步博弈蒙特卡洛搜索多树变种方法有效

申请号：	201910860992.8	申请日：	2019-09-11
公开（公告）号：	CN110489668A	公开（公告）日：	2019-11-22
发明（设计）人：	潘家鑫;黄湛钧;高庆龙;王骄	申请（专利权）人：	东北大学
主分类号：	G06F16/9536	分类号：	G06F16/9536;G06F16/22;G06F16/2455;A63F13/70;A63F13/67;A63F13/58
代理公司：	21212 大连东方专利代理有限责任公司	代理人：	姜玉蓉;李洪福<国际申请>=<国际公布>
地址：	110819 辽宁***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种非完备信息下同步博弈蒙特卡洛搜索多树变种方法，包括：S1:对于玩家的策略将根据已知的经验信息推测剩余信息；S2:在博弈树展开前对所有信息进行采样，筛选合法动作；S3:在博弈树搜索后，将每个博弈树的搜索结果再进行训练，预测出最终优势策略：S4:根据不同的玩家设置两棵博弈树，其中不同玩家的博弈树之间是互相联系，每轮对多个博弈树同时展开，展开前的采样内容相同，每个从玩家角度开始展开动作是根据自己的信息集，对于对手的动作直接根据其他树映射获得。
搜索关键词：	博弈树搜索采样内容经验信息剩余信息搜索结果博弈信息集变种采样映射筛选预测合法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种非完备信息下同步博弈蒙特卡洛搜索多树变种方法，其特征在于，包括：/nS1:对于玩家的策略将根据已知的经验信息推测剩余信息，筛选合法动作，再将完美信息博弈对手策略估计方式转移到非完美信息博弈中推测和观察到的信息中，在搜索之外对每个状态下对手的习惯动作进行记录，建立策略辅助函数；/nS2:在博弈树展开前对所有信息进行采样，筛选合法动作：将对手在之前的博弈过程中执行的动作进行记录，根据实际需要设定阈值，将在该阈值内的动作收益筛选出来，对玩家和对手收益高的动作进行标记，建立一个动作信息库并存储：/nS3:在博弈树搜索后，将每个博弈树的搜索结果再进行训练，预测出最终优势策略：将搜索的结果进行结合，将这些从不同角度玩家和不同采样动作的博弈树的搜索结果进行比较，使用趋同决策法选取最后反应所有博弈树求解结果倾向的结果值；/nS4:根据不同的玩家设置两棵博弈树，其中不同玩家的博弈树之间是互相联系，每轮对多个博弈树同时展开，展开前的采样内容相同，每个从玩家角度开始展开动作是根据自己的信息集，对于对手的动作直接根据其他树映射获得。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东北大学，未经东北大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910860992.8/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]非完备信息下同步博弈蒙特卡洛搜索多树变种方法有效

专利文献下载