[发明专利]点击率预测方法、预测模型的训练方法、装置及设备在审
申请号: | 201910630380.X | 申请日: | 2019-07-12 |
公开(公告)号: | CN110363346A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 杜颖 | 申请(专利权)人: | 腾讯科技(北京)有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/02 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 邢少真 |
地址: | 100080 北京市海淀区海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测模型 训练样本 点击率 装置及设备 预测 机器学习领域 热度信息 属性信息 样本对象 用户信息 权重 输出 申请 | ||
1.一种点击率预测方法,其特征在于,所述方法包括:
获取用户信息和推荐对象的属性信息,所述属性信息包括热度信息,所述热度信息用于反映所述推荐对象的被关注程度;
将所述用户信息和所述推荐对象的属性信息输入至预测模型,所述预测模型基于多个训练样本训练得到,每个所述训练样本的权重根据所述训练样本的类型和所述训练样本中样本对象的热度信息确定,其中,所述训练样本的类型包括正样本或负样本;
获取所述预测模型输出的所述推荐对象的点击率。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述多个训练样本,所述多个训练样本包括类型为正样本的训练样本,以及类型为负样本的训练样本;
对于每个所述训练样本,根据所述训练样本的类型和所述训练样本中样本对象的热度信息,确定所述训练样本的权重;
根据每个所述训练样本的权重,对所述多个训练样本进行训练,得到所述预测模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述训练样本的类型和所述训练样本中样本对象的热度信息,确定所述训练样本的权重,包括:
根据所述训练样本的类型和所述训练样本中样本对象的热度信息,调整基础权重,得到所述训练样本的权重;
其中,对于类型和热度信息中任一参数不同的两个训练样本,对所述基础权重的调整幅度不同。
4.根据权利要求3所述的方法,其特征在于,所述根据所述训练样本的类型和所述训练样本中样本对象的热度信息,调整基础权重,得到所述训练样本的权重,包括:
若所述训练样本的类型为正样本,且所述热度信息指示的热度与热度阈值的差值大于第一差值,则减小基础权重,得到所述训练样本的权重;
若所述训练样本的类型为正样本,且所述热度信息指示的热度与热度阈值的差值不大于第二差值,则增大基础权重,得到所述训练样本的权重;
若所述训练样本的类型为负样本,且所述热度信息指示的热度与热度阈值的差值大于第一差值,则增大基础权重,得到所述训练样本的权重;
若所述训练样本的类型为负样本,且所述热度信息指示的热度与热度阈值的差值不大于第二差值,则减小基础权重,得到所述训练样本的权重;
其中,所述第一差值大于或等于0,所述第二差值小于或等于0。
5.根据权利要求2至4任一所述的方法,其特征在于,
类型为正样本的训练样本的权重,与所述训练样本中样本对象的热度信息指示的热度负相关;
类型为负样本的训练样本的权重,与所述训练样本中样本对象的热度信息指示的热度正相关。
6.根据权利要求2至4任一所述的方法,其特征在于,所述根据每个所述训练样本的权重,对所述多个训练样本进行训练,得到所述预测模型,包括:
将每个训练样本中的样本用户信息和样本对象的属性信息输入至初始模型,得到所述初始模型输出的所述样本对象的预测点击率;
基于多个训练样本中,每个训练样本的权重,以及样本对象的点击标签与预测点击率的差值,构建损失函数。
调整所述初始模型的模型参数直至所述损失函数收敛,得到所述预测模型。
7.一种预测模型的训练方法,其特征在于,所述方法包括:
获取多个训练样本,所述多个训练样本包括类型为正样本的训练样本,以及类型为负样本的训练样本;
对于每个所述训练样本,根据所述训练样本的类型和所述训练样本中样本对象的热度信息,确定所述训练样本的权重;
根据每个所述训练样本的权重,对所述多个训练样本进行训练,得到预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(北京)有限公司,未经腾讯科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910630380.X/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理