[发明专利]一种模型训练的方法、信息处理的方法以及相关装置有效
申请号: | 201910861875.3 | 申请日: | 2019-09-11 |
公开(公告)号: | CN110598853B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 钟涛 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F16/23;G06F16/27;A63F1/00 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 吴磊 |
地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 信息处理 以及 相关 装置 | ||
1.一种模型训练的方法,其特征在于,包括:
获取交互对象对应的参数,所述参数包括平面特征参数、数值特征参数以及第一特征向量,所述平面特征参数为所述交互对象在交互过程中产生的非数值信息,所述平面特征参数包括手牌参数,公共牌参数,牌型强度参数,交互对象的位置参数,交互阶段参数,交互对象的历史操作参数以及交互对象状态参数中的一种或多种;所述数值特征参数为所述交互对象在交互过程中产生的数值信息,所述数值特征参数包括基础数值,累计数值,交互对象的剩余数值,牌型强度数值,牌型胜率,投入值以及增加值中的一种或多种;所述第一特征向量为所述交互对象在交互过程中产生的操作信息;
根据所述平面特征参数、所述数值特征参数以及所述第一特征向量,通过待训练模型获取第二特征向量,其中,所述待训练模型包括第一待训练子模型以及第二待训练子模型,平面特征参数与所述第一待训练子模型具有第一对应关系,所述数值特征参数与所述第二待训练子模型具有第二对应关系;
通过损失函数获取所述第一特征向量与所述第二特征向量所对应的损失值;
当所述损失值达到收敛时,获取所述待训练模型对应的模型参数,得到目标模型。
2.根据权利要求1所述的方法,其特征在于,所述获取交互对象对应的参数包括:
获取所述交互对象对应的激进度,所述激进度用于描述所述交互对象的激进程度;
根据所述激进度对所述交互对象分类,得到所述交互对象的类别;
根据所述交互对象的类别,获取所述类别其中一类所对应的参数。
3.根据权利要求1所述的方法,其特征在于,所述当所述损失值达到收敛时,获取所述待训练模型对应的模型参数,得到目标模型之后,所述方法还包括:
通过区块链同步所述目标模型。
4.一种信息处理的方法,其特征在于,包括:
获取交互对象对应的参数,所述参数包括平面特征参数、数值特征参数,所述平面特征参数为所述交互对象在交互过程中产生的非数值信息,所述平面特征参数包括手牌参数,公共牌参数,牌型强度参数,交互对象的位置参数,交互阶段参数,交互对象的历史操作参数以及交互对象状态参数中的一种或多种;所述数值特征参数为所述交互对象在交互过程中产生的数值信息,所述数值特征参数包括基础数值,累计数值,交互对象的剩余数值,牌型强度数值,牌型胜率,投入值以及增加值中的一种或多种;
通过目标模型获取所述交互对象对应的操作向量,所述目标模型包括第一子模型和第二子模型,所述第一子模型与所述平面特征参数具有第一对应关系,所述第二子模型与所述数值特征参数具有第二对应关系;
生成所述交互对象的操作信息,所述操作信息与所述操作向量具有关联关系。
5.根据权利要求4所述的方法,其特征在于,所述生成所述交互对象的操作信息之后,所述方法还包括:
通过区块链同步所述操作信息。
6.一种模型训练的装置,其特征在于,包括:
获取单元,用于获取交互对象对应的参数,所述参数包括平面特征参数、数值特征参数以及第一特征向量,所述平面特征参数为所述交互对象在交互过程中产生的非数值信息,所述平面特征参数包括手牌参数,公共牌参数,牌型强度参数,交互对象的位置参数,交互阶段参数,交互对象的历史操作参数以及交互对象状态参数中的一种或多种;所述数值特征参数为所述交互对象在交互过程中产生的数值信息,所述数值特征参数包括基础数值,累计数值,交互对象的剩余数值,牌型强度数值,牌型胜率,投入值以及增加值中的一种或多种;所述第一特征向量为所述交互对象在交互过程中产生的操作信息;
处理单元,用于根据所述平面特征参数、所述数值特征参数以及所述第一特征向量,通过待训练模型获取第二特征向量,其中,所述待训练模型包括第一待训练子模型以及第二待训练子模型,平面特征参数与所述第一待训练子模型具有第一对应关系,所述数值特征参数与所述第二待训练子模型具有第二对应关系;
处理单元,还用于通过损失函数获取所述第一特征向量与所述第二特征向量所对应的损失值;
处理单元,还用于当所述损失值达到收敛时,获取所述待训练模型对应的模型参数,得到目标模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910861875.3/1.html,转载请声明来源钻瓜专利网。