[发明专利]一种推荐模型训练的方法及装置在审
申请号: | 202010668973.8 | 申请日: | 2020-07-13 |
公开(公告)号: | CN111950593A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 程朋祥;陈飞;董振华;李震国;何秀强 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/9535;G06Q10/04 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 李杭 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 推荐 模型 训练 方法 装置 | ||
1.一种推荐模型训练的方法,其特征在于,所述方法包括:
获取至少两个用户的用户样本数据,所述用户样本数据包括特征数据和样本标签,所述特征数据包括推荐对象特征和用户特征,所述样本标签用于表示用户对所述推荐对象的选择情况,所述至少两个用户中每个用户的用户样本数据包括第一训练集和第二训练集;
根据所述每个用户的所述第一训练集训练推荐模型,所述推荐模型包括K个推荐单模型和模型选择器,K为大于1的整数;
获取训练后的所述每个用户的所述推荐模型的模型参数,所述模型参数包括所述K个推荐单模型参数和所述模型选择器参数;
根据所述至少两个用户的第二训练集和综合损失函数综合训练所述推荐模型,获取综合训练后的所述推荐模型,所述综合损失函数是根据所述每个用户的所述推荐模型的模型参数获取的。
2.根据权利要求1所述的方法,其特征在于,所述综合损失函数是根据所述每个用户的所述推荐模型的模型参数获取的,具体包括:
根据所述每个用户的所述推荐模型的模型参数获取所述每个用户的所述推荐模型的损失函数;
根据所述每个用户的所述推荐模型的损失函数获取所述综合损失函数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述每个用户的第一训练集获取每个用户各自的损失函数包括:
根据如下公式获取所述每个用户各自的损失函数:
其中,为所述每个用户各自的第一训练集,x为所述第一训练集的特征数据,y为所述第一训练集的样本标签,θ为所述K个推荐单模型的参数,为所述模型选择器的参数,是二进制交叉熵损失函数,是所述每个用户各自的损失函数;
所述根据所述每个用户各自的损失函数获取所述每个用户的推荐模型包括:
根据如下公式获取所述每个用户的推荐模型:
其中,α是内层梯度更新的学习率,为所述每个用户训练后的所述推荐模型,θu为训练后的所述K个推荐单模型模型参数,为所述训练后的所述模型选择器参数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述至少两个用户的第二训练集和综合损失函数综合训练所述推荐模型包括:
根据如下公式综合训练所述推荐模型:
其中,是所述综合损失函数,Ut是所述至少两个用户中所有用户的第二训练集,u为第二训练集中每个用户的用户样本数据,β是外层梯度更新的学习率,m是所述第二训练集中的用户个数,为综合训练之前的推荐模型,θ为综合训练前的所述K个推荐单模型参数,为综合训练前的所述模型选择器的参数,为综合训练后的推荐模型,θ'为综合训练后的K个推荐单模型参数,为综合训练后的模型选择器参数。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取待预测用户的特征数据;
根据所述综合训练后的推荐模型和所述待预测用户的特征数据获取待预测用户推荐对象的推荐概率。
6.根据权利要求5所述的方法,其特征在于,所述根据所述综合训练后的推荐模型和所述待预测用户的特征数据获取待预测用户推荐对象的推荐概率包括:
根据如下公式获取待预测用户推荐对象的推荐概率:
其中,x是所述待预测用户的特征数据,λ是所述推荐单模型在模型选择器上的权重分布向量,S()是分布函数,MK()为第K个推荐单模型,λK是所述权重分布向量λ的第K个推荐单模型的权重分布值,θ'K是第K个推荐单模型的推荐单模型的参数,表示待预测用户推荐对象的推荐概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010668973.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种升降机轿厢的固定组件
- 下一篇:一种具有定型传动结构的瓷砖加工切割装置