[发明专利]模型训练的方法、装置、计算机设备及存储介质在审
申请号: | 202110969102.4 | 申请日: | 2021-08-23 |
公开(公告)号: | CN113807515A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 浦嘉澍;毛晓曦;吴润泽;沈旭东;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06K9/62;G06Q30/06 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 徐世俊 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 计算机 设备 存储 介质 | ||
1.一种模型训练的方法,其特征在于,包括:
获取待训练的特征提取模型的第一行为样本,所述第一行为样本包括用户在目标游戏中的多个历史行为序列;
将所述第一行为样本输入所述特征提取模型,基于所述第一行为样本对所述特征提取模型进行无监督训练,得到训练完成的特征提取模型;
基于所述训练完成的特征提取模型提取第二行为样本的特征向量,其中,所述第二行为样本包括用户在目标游戏中的多个历史行为序列,所述第二行为样本中的每个历史行为序列具有对应的标签,所述标签用于指示对应的历史行为序列后的预设时长内发生的目标行为的类型;
将所述特征向量输入待训练的行为分类模型,通过所述行为分类模型预测所述第二行为样本中每个历史行为序列后的预设时长内发生的目标行为的类型,得到预测结果;
基于所述预测结果和所述第二行为样本中的所述标签调整所述行为分类模型的参数,得到训练完成的行为分类模型。
2.根据权利要求1所述的方法,其特征在于,所述获取待训练的特征提取模型的第一行为样本,包括:
获取用户在所述目标游戏中的历史游戏行为记录;
将所述历史游戏行为记录分割为多个行为信息,对所述多个行为信息进行排序,得到由所述多个行为信息组成的历史行为序列;
根据所述历史行为序列得到所述第一行为样本。
3.根据权利要求2所述的方法,其特征在于,所述行为信息包含用于表征行为的操作信息和用于表征行为对象的对象信息。
4.根据权利要求2所述的方法,其特征在于,所述将所述历史游戏行为记录分割为多个行为信息,对所述多个行为信息进行排序,得到由所述多个行为信息组成的历史行为序列,包括:
将所述历史游戏行为记录分割为多个行为信息,根据多个所述行为信息的发生时间先后顺序进行排序,形成初始行为序列;
确定所述初始行为序列中的至少一组待合并行为信息,所述待合并行为信息包括至少两个相邻的行为信息,且所述待合并行为信息在所述初始行为序列中出现次数最多;
合并每一组待合并历史行为信息包括的至少两个行为信息,在所述初始行为序列中形成新的行为信息,以更新所述初始行为序列;
返回执行所述确定所述初始行为序列中的至少一组待合并行为信息的步骤,直到所述初始行为序列中的行为信息的数量达到预设数量,得到由所述预设数量的行为信息组成的历史行为序列。
5.根据权利要求4所述的方法,其特征在于,所述确定所述初始行为序列中的至少一组待合并行为信息,包括:
获取所述历史游戏行为记录中包括的全部行为信息,以及各个行为信息在所述历史游戏行为记录中的出现次数;
根据各个行为信息,以及各个行为信息对应的出现次数,形成词表;
在所述初始行为序列中获取至少两个相邻的行为信息,根据所述词表,获取所述至少两个相邻的行为信息的出现次数总和;
确定所述出现次数总和最多的至少两个相邻的行为信息,作为所述待合并行为信息。
6.根据权利要求1所述的方法,其特征在于,所述历史行为序列包括多个行为信息,所述将所述第一行为样本输入所述特征提取模型,基于所述第一行为样本对所述特征提取模型进行无监督训练,得到训练完成的特征提取模型,包括:
利用掩码替换所述第一行为样本中的至少一个历史行为序列中的至少一个行为信息;
通过所述特征提取模型提取所述第一行为样本的特征向量;
通过所述特征提取模型,基于所述特征向量预测所述第一行为样本中被所述掩码替换的行为信息,得到预测游戏行为信息;
基于所述预测游戏行为信息和被所述掩码替换的行为信息,调整所述待训练的特征提取模型的参数,得到训练完成的特征提取模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110969102.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实操用防撞刀车床
- 下一篇:一种自动化立体仓库的使用方法