[发明专利]一种游戏AI训练方法、装置及系统在审

申请号：	201811323771.9	申请日：	2018-11-07
公开（公告）号：	CN109550252A	公开（公告）日：	2019-04-02
发明（设计）人：	徐波	申请（专利权）人：	广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司
主分类号：	A63F13/67	分类号：	A63F13/67;A63F13/358;G06N20/00
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	麦小婵;郝传鑫
地址：	510000 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种游戏AI训练方法、装置及系统，其中所述方法包括：当运行游戏进程时，将采集的当前状态数据传输至服务端；控制延迟动作的执行；获取当前状态数据对应的决策数据，并结束延迟动作的执行；根据决策数据控制被训练的游戏AI角色执行决策动作，并生成回报数据和后续状态数据；将当前状态数据、决策数据、回报数据和后续状态数据组织成训练样本，并将训练样本传输至服务端，以实现服务端基于训练样本对训练网络进行训练并根据训练网络的数据更新决策网络，直至网络收敛。本发明能够在客户端等待服务端返回决策数据期间，控制延迟动作的执行，使得游戏持续运行，从而使得没有内置游戏暂停功能的游戏也能实现游戏AI训练正常进行。
搜索关键词：	游戏决策数据训练样本延迟动作服务端装置及系统后续状态训练网络状态数据状态数据传输持续运行等待服务决策网络数据更新数据组织网络收敛运行游戏客户端回报内置采集传输返回角色决策进程
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种游戏AI训练方法，其特征在于，适用于客户端，所述方法包括：当运行游戏进程时，将采集的当前状态数据传输至服务端；其中，所述游戏进程是由所述服务端分配的；控制延迟动作的执行；其中，所述延迟动作为等待所述服务端返回所述当前状态数据对应的决策数据时，被训练的游戏AI角色执行的动作；获取所述当前状态数据对应的决策数据，并结束所述延迟动作的执行；根据所述当前状态数据对应的决策数据控制所述被训练的游戏AI角色执行决策动作，并生成回报数据和后续状态数据；将所述当前状态数据、所述决策数据、所述回报数据和所述后续状态数据组织成训练样本，并将所述训练样本传输至服务端，以实现所述服务端基于所述训练样本对所述服务端的训练网络进行训练并根据训练网络的数据更新所述服务端的决策网络，直至网络收敛。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司，未经广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811323771.9/，转载请声明来源钻瓜专利网。

上一篇：一种智能化的植物养护系统
下一篇：游戏加载方法、装置、存储介质、处理器及终端

同类专利

专利分类

A 农业

A63 运动；游戏；娱乐活动
A63F 纸牌、棋盘或轮盘赌游戏；利用小型运动物体的室内游戏；其他类目不包含的游戏
A63F13-00 使用二维或多维电子显示器
A63F13-02 .附件
A63F13-08 .结构零件或布置，例如其他类目不包括的壳体、导线、连接件、操纵台
A63F13-10 .游戏过程的控制，例如开始、进行、结束
A63F13-12 .涉及若干游戏装置之间的相互作用，例如传送和分配系统
A63F13-04 ..用于命中显示器上的特殊区域，如具有光电探测装置的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种游戏AI训练方法、装置及系统在审

专利文献下载