[发明专利]对战格斗类AI游戏模型的生成方法、装置、设备及介质有效
申请号: | 202110265501.2 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112870722B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 杨敬文 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | A63F13/58 | 分类号: | A63F13/58;A63F13/63;A63F13/79;A63F13/833;G06K9/62 |
代理公司: | 北京励诚知识产权代理有限公司 11647 | 代理人: | 赵爽 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 格斗 ai 游戏 模型 生成 方法 装置 设备 介质 | ||
1.一种对战格斗类AI游戏模型的生成方法,其特征在于,包括:
获取第一对战格斗类AI游戏模型;
初始化所述第一对战格斗类AI游戏模型中的参数,以得到第三对战格斗类AI游戏模型;
在两个AI游戏角色的每轮对弈过程中,将当前游戏局面对应的游戏局面信息输入所述第三对战格斗类AI游戏模型,以得到所述两个AI游戏角色各自的动作概率分布,并控制所述两个AI游戏角色根据各自的动作概率分布执行对应的动作,以进入下一个游戏局面,将所述下一个游戏局面作为新的当前游戏局面,直至所述两个AI游戏角色决出胜负;
生成所述两个AI游戏角色中胜利方对应的多个第一训练样本和失败方对应的多个第二训练样本;
在所述多个第二训练样本中选择至少一个第二训练样本;
针对所述至少一个第二训练样本中的任一个第二训练样本,根据所述第二训练样本对应的第二游戏局面信息,对所述第二训练样本对应的第二动作概率分布进行调整,以得到第三动作概率分布;
生成第三训练样本,其中,所述多个第一训练样本、所述多个第二训练样本和所述第三训练样本构成多个训练样本;
根据所述多个训练样本训练所述第一对战格斗类AI游戏模型,以得到第二对战格斗类AI游戏模型;
其中,每个所述训练样本包括:游戏局面信息、动作概率分布和获胜率;
任一个所述第一训练样本包括:第一游戏局面信息、第一动作概率分布和1;所述第一游戏局面信息是所述每轮对弈过程中所述胜利方所获取到的任一游戏局面信息;所述第一动作概率分布是所述胜利方在所述第一游戏局面信息下的动作概率分布;1表示所述胜利方的获胜率为1;
任一个所述第二训练样本包括:第二游戏局面信息、第二动作概率分布和-1;所述第二游戏局面信息是所述每轮对弈过程中所述失败方所获取到的任一游戏局面信息;所述第二动作概率分布是所述失败方在所述第一游戏局面信息下的动作概率分布;-1表示所述失败方的获胜率为-1;
所述第三训练样本包括:所述第二训练样本对应的第二游戏局面信息、所述第三动作概率分布和0,0表示获胜率为0。
2.根据权利要求1所述的方法,其特征在于,所述动作概率分布涉及的动作包括:向左移动、向右移动、向上移动、攻击、跳跃、格挡。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述多个训练样本训练所述第一对战格斗类AI游戏模型,以得到第二对战格斗类AI游戏模型,包括:
通过第四训练样本训练所述第一对战格斗类AI游戏模型,以得到第四对战格斗类AI游戏模型;所述第四训练样本为所述多个训练样本中的任一个训练样本;
将所述多个训练样本中除所述第四训练样本中的任一个训练样本作为新第四训练样本,将所述第四对战格斗类AI游戏模型作为新第一对战格斗类AI游戏模型,通过新第四训练样本训练新第一对战格斗类AI游戏模型,直至训练结束,以得到所述第二对战格斗类AI游戏模型;
其中,所述第四训练样本包括:第三游戏局面信息、第四动作概率分布和第一获胜率。
4.根据权利要求3所述的方法,其特征在于,所述通过第四训练样本训练所述第一对战格斗类AI游戏模型,以得到第四对战格斗类AI游戏模型,包括:
将所述第三游戏局面信息输入所述第一对战格斗类AI游戏模型中,以得第五动作概率分布和第二获胜率;
根据所述第四动作概率分布、所述第五动作概率分布、所述第一获胜率和所述第二获胜率,训练所述第一对战格斗类AI游戏模型,以得到所述第四对战格斗类AI游戏模型。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第四动作概率分布、所述第五动作概率分布、所述第一获胜率和所述第二获胜率,训练所述第一对战格斗类AI游戏模型,以得到所述第四对战格斗类AI游戏模型,包括:
计算所述第四动作概率分布和所述第二动作概率分布的交叉熵;
计算所述第一获胜率和所述第二获胜率的均方误差;
根据所述交叉熵和所述均方误差,训练所述第一对战格斗类AI游戏模型,以得到所述第四对战格斗类AI游戏模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110265501.2/1.html,转载请声明来源钻瓜专利网。