[发明专利]一种用于商品推荐的排序模型的训练方法、装置及系统在审
申请号: | 202010797701.8 | 申请日: | 2020-08-10 |
公开(公告)号: | CN112116411A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 刘正夫;王铖骅 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06N20/10 |
代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 吴秀娥 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 商品 推荐 排序 模型 训练 方法 装置 系统 | ||
本公开提供了一种用于商品推荐的排序模型的训练方法、装置及系统,该方法包括:获取反映用户信息的用户数据表、反映商品信息的商品数据表、及反映目标用户针对目标商品执行指定操作的用户行为数据表;根据所述用户数据表、所述商品数据表和所述用户行为数据表,生成初始样本集;根据预先选定的机器学习算法,基于所述初始样本集进行机器学习模型训练,得到评分模型;根据所述评分模型,从所述初始样本集中筛选符合预设条件的样本,生成最终样本集;基于所述最终样本集进行机器学习训练,得到用于商品推荐的排序模型。
技术领域
本说明书涉及机器学习模型技术领域,更具体地,涉及一种用于商品推荐的排序模型的训练方法、一种用于商品推荐的排序模型的训练装置、一种包括至少一个计算装置和至少一个存储装置的系统及一种计算机可读存储介质。
背景技术
随着大数据技术的普及,利用数据挖掘的方法构建商品推荐系统越来越普及。通常来说推荐系统一般分为两个部分:召回和排序。召回负责减少商品量,对某个具体用户而言,召回模块负责提供该用户的产品候选集。排序模块则将这些产品候选集进行排序,将排序靠前的商品推荐给对应的客户。
训练排序模块中的排序模型需要构建正负样本,通常正负样本维持在一个合适的比例可以让排序模型取得较优的效果。但是在实际场景中,负样本的数量通常不能满足正负样本的比例,这时需要人工的构建负样本。
传统方法在构建负样本时,通常先构建用户和商品的笛卡尔乘积,然后从笛卡尔乘积结果中进行采样选出部分作为负样本。但是,当传统方法在对笛卡尔乘积采样较少样本时,样本信息量通常不足以使排序模型学到有用的信息。让采样较多时,采集的样本中又可能混入了大量的正样本,这使得用来训练模型的样本标签不够准确。
发明内容
本说明书的一个目的是提供一种训练用于商品推荐的排序模型的新技术方案。
根据本说明书的第一方面,提供了一种用于商品推荐的排序模型的训练方法,包括:
获取反映用户信息的用户数据表、反映商品信息的商品数据表、及反映目标用户针对目标商品执行指定操作的用户行为数据表;
根据所述用户数据表、所述商品数据表和所述用户行为数据表,生成初始样本集;
根据预先选定的机器学习算法,基于所述初始样本集进行机器学习模型训练,得到评分模型;
根据所述评分模型,从所述初始样本集中筛选符合预设条件的样本,生成最终样本集;
基于所述最终样本集进行机器学习训练,得到用于商品推荐的排序模型。
可选的,所述根据所述用户数据表、所述商品数据表和所述用户行为数据表,生成初始样本集包括:
根据所述用户数据表、所述商品数据表和所述用户行为数据表,生成标签为第一设定值的正样本集和标签为第二设定值的负样本集;
根据所述用户数据表和所述商品数据表生成第一样本集;
将所述第一样本集中的每条第一样本的标签标记为第二设定值;
将所述第一样本集、所述正样本集和所述负样本集进行合并,得到所述初始样本集。
可选的,所述根据所述用户数据表、所述商品数据表和所述用户行为数据表,生成标签为第一设定值的正样本集和标签为第二设定值的负样本集包括:
根据所述用户行为数据表,确定目标用户针对目标商品执行第一指定操作的第一用户商品对,和所述目标用户针对目标商品执行第二指定操作、且未执行所述第一指定操作的第二用户商品对;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010797701.8/2.html,转载请声明来源钻瓜专利网。