[发明专利]基于人工智能的棋牌关卡生成方法、训练方法及装置有效
申请号: | 201910764301.4 | 申请日: | 2019-08-19 |
公开(公告)号: | CN110458295B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 范俊杰;曾子骄 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/08;G06K9/62;G06Q10/04;A63F13/79;A63F13/45 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 棋牌 关卡 生成 方法 训练 装置 | ||
本申请公开了一种基于人工智能的棋牌关卡生成方法、训练方法、装置及终端,属于人机交互领域。所述方法包括:生成棋牌初始牌局;根据第一人工智能模型和第二人工智能模型进行棋牌对战,得到所述棋牌初始牌局的n个对战结果;所述第一人工智能模型是采用固定策略的机器学习模型,所述第二人工智能模型是采用随机策略的机器学习模型,n为正整数;根据所述棋牌初始牌局的n个对战结果,得到所述棋牌初始牌局对应的统计数据;根据所述棋牌初始牌局对应的对战统计数据确定所述棋牌初始牌局的难度系数,所述难度系数用于确定所述棋牌初始牌局在棋牌关卡中的关卡位置。
技术领域
本申请实施例涉及人工智能领域,特别涉及一种基于人工智能的棋牌关卡生成方法、训练方法及装置。
背景技术
在线棋牌类游戏是基于计算机网络技术将多个客户端连接起来以实现联机棋牌的应用程序。在线棋牌类游戏提供有闯关模式,用户可以参与闯关模式来完成多级对战。
以麻将棋牌类游戏为例,服务器按照第一代码规则生成每个用户的棋牌初始牌局,棋牌初始牌局中包括若干个将、刻子和顺子等,使得玩家胡牌难度降低。再按照第二代码规则为每个用户分配对局中的棋牌。其中,第一代码规则和第二代码规则是由程序员设计的代码。
但是上述方式中的第一代码规则和第二代码规则的设计难度较大,也无法衡量每个棋牌初始牌局的难易程度,有时候会出现排序较早的棋牌初始牌局的难度很大,而排序较晚的棋牌初始牌局的难度较小的情况。
发明内容
本申请提供了一种基于人工智能的棋牌关卡生成方法、训练方法及装置,可以解决由代码规则所生成的棋牌初始牌局,无法衡量难易程度的问题。所述技术方案如下:
根据本申请的一方面,提供了一种基于人工智能的棋牌关卡生成方法,所述方法包括:
生成棋牌初始牌局;
根据第一人工智能模型和第二人工智能模型进行棋牌对战,得到所述棋牌初始牌局的n个对战结果;所述第一人工智能模型是采用固定策略的机器学习模型,所述第二人工智能模型是采用随机策略的机器学习模型,n为正整数;
根据所述棋牌初始牌局的n个对战结果,得到所述棋牌初始牌局对应的统计数据;
根据所述棋牌初始牌局对应的对战统计数据确定所述棋牌初始牌局的难度系数,所述难度系数用于确定所述棋牌初始牌局在棋牌关卡中的关卡位置。
根据本申请的另一方面,提供了一种人工智能模型的训练方法,所述方法包括:
获取多组训练样本,每组所述训练样本包括:样本棋牌初始牌局和所述样本棋牌初始牌局的历史对局行为数据;
对于每组所述训练样本,将所述样本棋牌初始牌局的历史对局行为数据中的第1手至第i手样本对局行为转换为一组输入数据,i为正整数;
将所述输入数据输入至第一人工智能模型进行对局行为预测,得到第i+1手预测对局行为;
根据所述第i+1手预测对局行为和所述历史对局行为数据中的第i+1手样本对局行为计算第一损失函数,所述第一损失函数是用于衡量对局行为的预测准确性的损失函数;
根据所述第一损失函数对所述第一人工智能模型中的模型参数进行误差反向传播。
根据本申请的另一方面,提供了一种人工智能模型的训练方法,所述方法包括:
获取多组训练样本,每组所述训练样本包括:样本棋牌初始牌局和所述样本棋牌初始牌局的历史对局行为数据和样本胜负情况;
对于每组所述训练样本,将所述样本棋牌初始牌局的历史对局行为数据中的第1手至第i手样本对局行为转换为一组输入数据,i为正整数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910764301.4/2.html,转载请声明来源钻瓜专利网。