[发明专利]推荐模型训练方法、推荐方法、装置、设备及存储介质在审
申请号: | 202210522405.6 | 申请日: | 2022-05-13 |
公开(公告)号: | CN115129975A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 李聪;于海斌;全世杰;罗飞恒 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9537;G06K9/62;G06N20/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 朱佳 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推荐 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种推荐模型训练方法,其特征在于,所述方法包括:
获得样本数据集合,每个样本数据包含:样本对象、样本多媒体信息以及所述样本对象选择所述样本多媒体信息的样本概率;
基于样本数据集合,对待训练的推荐模型进行至少一轮迭代训练,输出相应的目标推荐模型;其中,在每轮迭代过程中,至少执行以下步骤:
基于参考模型,对提取的样本数据进行特征分析,获得表征相应的样本对象和样本多媒体信息之间的关联程度的交叉特征集,并至少基于所述交叉特征集,确定所述样本对象选择所述样本多媒体信息的第一预估概率;
基于所述待训练的推荐模型,对提取的样本数据进行特征分析,获得所述样本对象和样本多媒体信息各自的综合特征,并基于获得的各综合特征,确定所述样本对象选择所述样本多媒体信息的第二预估概率;其中,所述参考模型从M个特征维度获得所述交叉特征集,所述推荐模型从N个特征维度获得各综合特征,MN;
基于所述第一预估概率、所述第二预估概率和相应的样本概率,确定相应的训练损失,并对所述待训练的推荐模型进行模型参数调整。
2.根据权利要求1所述的方法,其特征在于,所述基于参考模型,对提取的样本数据进行特征分析,获得表征相应的样本对象和样本多媒体信息之间的关联程序的交叉特征集,包括:
基于所述参考模型,对所述提取的样本数据进行特征提取,获得相应的样本对象的各对象子特征,以及获得相应的样本多媒体信息的各信息子特征;其中,每个对象子特征表征所述样本对象的一种状态属性,每个信息子特征表征所述样本多媒体信息的一种类别属性;
基于所述参考模型,分别将获得的各对象子特征与获得的各信息子特征进行两两组合,获得所述交叉特征集。
3.根据权利要求1或2所述的方法,其特征在于,所述提取的样本数据还包括:参考预估概率;所述参考预估概率为预设的所述样本对象选择所述样本多媒体信息的预估概率;
则所述至少基于所述交叉特征集,确定所述样本对象选择所述样本多媒体信息的第一预估概率,包括:
基于所述参考模型,获取所述交叉特征集中每个交叉特征各自对应的第一预设权重;
至少基于各交叉特征及其相应的第一预设权重,确定所述样本对象选择所述样本多媒体信息的初始预估概率;
基于所述初始预估概率、所述参考预估概率和相应的第二预设权重,确定所述样本对象选择所述样本多媒体信息的第一预估概率。
4.根据权利要求3所述的方法,其特征在于,所述推荐模型为应用于推荐系统中粗排阶段的模型,则所述参考预估概率是采用以下方式获得的:
基于应用于所述推荐系统中精排阶段的模型,确定所述样本对象选择所述样本多媒体信息的预估概率;
将所述预估概率,确定为所述参考预估概率。
5.根据权利要求1或2所述的方法,其特征在于,所述获得样本数据集合之后,所述至少基于所述交叉特征集,确定所述样本对象选择所述样本多媒体信息的第一预估概率之前,所述方法还包括:
基于所述参考模型,针对提取的样本数据,获得所述样本对象和样本多媒体信息各自的综合特征;
则所述至少基于所述交叉特征集,确定所述样本对象选择所述样本多媒体信息的第一预估概率,包括:
将所述交叉特征集中的各交叉特征与获得的各综合特征进行组合,形成一个特征组,基于所述特征组,确定所述样本对象选择所述样本多媒体信息的第一预估概率。
6.根据权利要求1或2所述的方法,其特征在于,基于所述第一预估概率、所述第二预估概率和相应的样本概率,确定相应的训练损失,包括:
当所述参考模型为已训练完毕的模型,则基于所述第一预估概率与所述第二预估概率之间的第一损失、以及所述样本概率与所述第二预估概率之间的第二损失,确定所述待训练的推荐模型相应的训练损失;
当所述参考模型为尚未训练完毕的模型,则基于所述第一预估概率与所述第二预估概率之间的第一损失、所述样本概率与所述第二预估概率之间的第二损失、以及所述样本概率与所述第一预估概率之间的第三损失,确定所述待训练的推荐模型相应的训练损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210522405.6/1.html,转载请声明来源钻瓜专利网。