[发明专利]基于交友场景的推荐模型的训练方法、装置、电子设备和计算机可读存储介质在审
申请号: | 202110409062.8 | 申请日: | 2021-04-16 |
公开(公告)号: | CN113051486A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 蔡成加 | 申请(专利权)人: | 深圳市珍爱捷云信息技术有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/9535 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518000 广东省深圳市南山区前海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 交友 场景 推荐 模型 训练 方法 装置 电子设备 计算机 可读 存储 介质 | ||
1.一种基于交友场景的推荐模型的训练方法,其特征在于,包括:
获取预设时间内目标应用程序的交友推荐页的用户行为数据集;
从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型,得到所述点击率预估模型,其中,所述点击率预估模型输出针对所述用户行为数据集执行极大似然计算得到的点击概率参数;
基于所述点击概率参数对待训练的推荐模型执行初始化,得到初始化推荐模型;
基于用户行为数据集构建第二样本集,将所述第二样本集代入所述初始化推荐模型进行训练,得到所述推荐模型。
2.根据权利要求1所述的方法,其特征在于,所述点击率预估模型采用逻辑回归LR模型结构。
3.根据权利要求1所述的方法,其特征在于,所述推荐模型采用SVMRank模型结构。
4.根据权利要求1所述的方法,其特征在于,所述基于用户行为数据集构建第二样本集,包括:
从所述用户行为数据集中提取多个用户对,所述多个用户对中每一所述用户对包括:主动用户和被动用户;
确定所述多个用户对的多个样本目标等级,基于所述多个用户对和所述多个样本目标等级构建多个训练样本对;
针对所述多个用户对中任意一个主动用户,从预设推荐用户列表中随机选取多个随机用户与所述任意一个主动用户构建多个随机用户对,所述多个随机用户对的样本目标等级为第一等级;
基于所述随机用户对所述第一等级构建多个随机样本对;
所述多个训练样本对和所述多个随机样本对构成所述第二样本集。
5.根据权利要求4所述的方法,其特征在于,所述确定所述多个用户对的样本目标等级,包括:
针对所述多个用户对中每一所述用户对,获取所述用户对的用户行为数据;
从所述用户行为数据中提取所述用户对的主动行为数和被动行为数;
判断所述被动行为数是否为零,若不为零,则确定所述样本目标等级为第四等级;
若所述被动行为数为零,则判断所述主动行为数是否大于预设阈值,若大于,则确定所述样本目标等级为第三等级;
若所述主动行为数不大于所述预设阈值,则确定所述样本目标等级为第二等级。
6.根据权利1-5任一项所述的方法,其特征在于,所述将所述第二样本集代入所述初始化推荐模型进行训练,包括:
提取所述样本目标等级对应的样本权重对所述第二样本集进行加权,得到训练样本集;
针对所述训练样本集执行特征提取操作,得到所述训练样本集对应的训练样本特征集;
对所述训练样本特征集执行归一化处理得到归一化后的训练样本特征集;
将所述归一化后的训练样本特征集代入所述初始化推荐模型进行训练。
7.根据权利要求1所述的方法,其特征在于,所述从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型,包括:
基于所述用户行为数据集筛选正样本子集和负样本子集,所述正样本子集和所述负样本子集构成所述第一样本集,其中所述正样本子集的正样本为用户针对所述交友推荐页执行点击操作的行为数据,所述负样本子集的负样本为所述用户针对所述交友推荐页未执行点击操作的行为数据;
对所述正样本子集和所述负样本子集执行特征提取操作,得到正样本特征集和负样本特征集;
通过所述正样本特征集和所述负样本特征集训练所述预设的点击率预估模型。
8.一种基于交友场景的推荐模型的训练装置,其特征在于,包括:
获取单元,用于获取预设时间内目标应用程序的交友推荐页的用户行为数据集;
第一训练单元,用于从所述用户行为数据集中筛选第一样本集训练预设的点击率预估模型,得到所述点击率预估模型,其中,所述点击率预估模型输出针对所述用户行为数据集执行极大似然计算得到的点击概率参数;
初始化单元,用于基于所述点击概率参数对待训练的推荐模型执行初始化,得到初始化推荐模型;
第二训练单元,用于基于用户行为数据集构建第二样本集,将所述第二样本集代入所述初始化推荐模型进行训练,得到所述推荐模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市珍爱捷云信息技术有限公司,未经深圳市珍爱捷云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110409062.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种心脑血管疾病遗传风险评估检测装置
- 下一篇:一种测试机资源转接板装置