[发明专利]游戏决策模型训练方法、游戏策略生成方法及装置有效
申请号: | 201910703748.0 | 申请日: | 2019-07-31 |
公开(公告)号: | CN110368690B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 钟涛 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | A63F13/52 | 分类号: | A63F13/52;A63F13/79;A63F13/822 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 游戏 决策 模型 训练 方法 策略 生成 装置 | ||
1.一种基于人工智能的游戏决策模型训练方法,其特征在于,包括:
获取游戏局面信息样本以及与所述游戏局面信息样本相关联的原始游戏策略样本;
获取所述原始游戏策略样本中的各个游戏组件的属性信息,并根据所述属性信息确定各个所述游戏组件的组件类型;
当所述原始游戏策略样本中包括基础类游戏组件和更替类游戏组件时,根据所述基础类游戏组件的属性信息将所述更替类游戏组件替换为目标游戏组件以得到基础游戏策略样本;
利用所述游戏局面信息样本和所述基础游戏策略样本对游戏决策模型进行训练,训练得到的游戏决策模型用于在电子牌类游戏中生成出牌策略。
2.根据权利要求1所述的基于人工智能的游戏决策模型训练方法,其特征在于,所述游戏决策模型用于在电子牌类游戏中生成出牌策略。
3.根据权利要求1所述的基于人工智能的游戏决策模型训练方法,其特征在于,利用所述游戏局面信息样本和所述基础游戏策略样本对游戏决策模型进行训练,包括:
根据所述基础游戏策略样本中的各个游戏组件的属性信息确定与所述基础游戏策略样本相对应的组件组合类型样本;
利用所述游戏局面信息样本和所述组件组合类型样本对游戏决策模型进行训练。
4.根据权利要求3所述的基于人工智能的游戏决策模型训练方法,其特征在于,所述根据所述基础游戏策略样本中的各个游戏组件的属性信息确定与所述基础游戏策略样本相对应的组件组合类型样本,包括:
根据所述基础游戏策略样本中的各个游戏组件的属性信息确定对应于多个分类维度的维度属性值;
根据所述维度属性值与组件组合类型的关联关系确定与所述基础游戏策略样本相对应的组件组合类型样本。
5.一种基于人工智能的游戏策略生成方法,其特征在于,包括:
获取当前游戏局面信息,并将所述当前游戏局面信息输入至游戏决策模型以得到基础游戏策略,所述游戏决策模型用于在电子牌类游戏中生成出牌策略;
获取所述基础游戏策略中的各个基础类游戏组件的属性信息;
根据所述当前游戏局面信息以及所述各个基础类游戏组件的属性信息将所述基础游戏策略中的一个或者多个基础类游戏组件确定为目标游戏组件;
将所述基础游戏策略中的所述目标游戏组件替换为更替类游戏组件以得到原始游戏策略。
6.根据权利要求5所述的基于人工智能的游戏策略生成方法,其特征在于,所述将所述当前游戏局面信息输入至游戏决策模型以得到基础游戏策略,包括:
将所述当前游戏局面信息输入至游戏决策模型以得到包括一个或者多个游戏组件的组件组合类型;
根据所述当前游戏局面信息和所述组件组合类型确定基础游戏策略。
7.一种基于人工智能的游戏决策模型训练装置,其特征在于,包括:
样本获取模块,被配置为获取游戏局面信息样本以及与所述游戏局面信息样本相关联的原始游戏策略样本;
组件类型确定模块,被配置为获取所述原始游戏策略样本中的各个游戏组件的属性信息,并根据所述属性信息确定各个所述游戏组件的组件类型;
第一组件替换模块,被配置为当所述原始游戏策略样本中包括基础类游戏组件和更替类游戏组件时,根据所述基础类游戏组件的属性信息将所述更替类游戏组件替换为目标游戏组件以得到基础游戏策略样本;
模型训练模块,被配置为利用所述游戏局面信息样本和所述基础游戏策略样本对游戏决策模型进行训练,训练得到的游戏决策模型用于在电子牌类游戏中生成出牌策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910703748.0/1.html,转载请声明来源钻瓜专利网。