[发明专利]一种游戏中智能体的训练及控制方法有效
申请号: | 202110065644.9 | 申请日: | 2021-01-18 |
公开(公告)号: | CN112870727B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 胡志鹏;黄叶;任春旭;胡裕靖;卜佳俊 | 申请(专利权)人: | 浙江大学;网易(杭州)网络有限公司 |
主分类号: | A63F13/822 | 分类号: | A63F13/822;A63F13/843;G06N3/04;G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 钟扬飞 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 游戏 智能 训练 控制 方法 | ||
1.一种游戏中智能体的控制方法,其特征在于,所述方法包括:
将游戏状态信息输入至预先训练完成的动作输出模型中;其中,所述动作输出模型包括主网络以及多个子网络;所述多个子网络中包含第一子网络集合和第二子网络集合,所述第一子网络集合对应智能体的友方角色,所述第二子网络集合对应所述智能体的敌方角色;
通过所述主网络输出与所述智能体或游戏环境相关的第一动作预测结果;通过所述子网络输出与所述智能体的友方角色或敌方角色相关的第二动作预测结果;
基于所述第一动作预测结果和第二动作预测结果,确定所述智能体的执行动作;
其中,所述动作输出模型通过下述方式训练得到:
根据当前游戏参与角色的数量,确定共同训练的多个初始模型的数量;其中,每个所述初始模型对应一种角色;
采用自对弈的方式,共同训练所述多个初始模型,得到训练完成后的所述多个初始模型;
根据每个所述初始模型在训练过程中的游戏成绩,从训练完成后的所述多个初始模型中确定出所述动作输出模型。
2.根据权利要求1所述的方法,其特征在于,所述多个子网络中,每个子网络对应一个友方角色或一个敌方角色。
3.根据权利要求1所述的方法,其特征在于,所述游戏状态信息包括:全局状态信息、所述智能体的角色状态信息、所述友方角色的角色状态信息以及所述敌方角色的角色状态信息。
4.根据权利要求1所述的方法,其特征在于,通过所述子网络输出与所述智能体的友方角色或敌方角色相关的第二动作预测结果的步骤,包括:
针对每个所述子网络,从所述游戏状态信息中获取所述子网络对应的目标角色的角色状态信息;
将所述目标角色的角色状态信息输入至所述子网络中,输出第二动作预测结果。
5.根据权利要求4所述的方法,其特征在于,所述子网络包括第一特征提取模块、第一嵌入层和第一动作层;
所述将所述目标角色的角色状态信息输入至所述子网络中,输出第二动作预测结果的步骤,包括:
将所述目标角色的角色状态信息输入至所述第一特征提取模块,输出第一初始特征信息;将所述第一初始特征信息以及所述主网络输出的全局特征信息输入至所述第一嵌入层,输出嵌入层特征信息;
将所述嵌入层特征信息输入至所述第一动作层,输出所述第二动作预测结果;其中,所述第二动作预测结果包括:所述智能体针对所述目标角色执行每个指定动作的概率。
6.根据权利要求5所述的方法,其特征在于,如果所述目标角色为友方角色,所述第二动作预测结果包括:所述智能体向所述友方角色释放每个指定技能的概率;
如果所述目标角色为敌方角色,所述第二动作预测结果包括:所述智能体向所述敌方角色释放每个指定技能的概率。
7.根据权利要求5所述的方法,其特征在于,将所述第一初始特征信息以及所述主网络输出的全局特征信息输入至所述第一嵌入层,输出嵌入层特征信息的步骤,包括:
通过所述第一嵌入层,对所述第一初始特征信息和所述全局特征信息进行Pairwise配对操作,得到所述嵌入层特征信息。
8.根据权利要求7所述的方法,其特征在于,对所述第一初始特征信息和所述全局特征信息进行Pairwise配对操作,得到所述嵌入层特征信息的步骤,包括:
将所述第一初始特征信息和所述全局特征信息进行拼接处理,得到拼接结果;将所述拼接结果输入至预设的全连接层,输出所述嵌入层特征信息。
9.根据权利要求7所述的方法,其特征在于,对所述第一初始特征信息和所述全局特征信息进行Pairwise配对操作,得到所述嵌入层特征信息的步骤,包括:
求取所述第一初始特征信息和所述全局特征信息的内积,得到内积结果;将所述内积结果确定为所述嵌入层特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学;网易(杭州)网络有限公司,未经浙江大学;网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110065644.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种道路路面平整度测量装置
- 下一篇:一种服装生产用服装处理装置及其安装方式